关系代数在数据集成中的应用+文献综述(2)
时间:2017-04-11 19:58 来源:毕业论文 作者:毕业论文 点击:次
的高度自治性导致了数据模式的异构性。另一方面,Internet 的高速发展使得各 个领域的合作越来越密切,数据的操作显得非常重要。为解决上述问题,实现异 构数据源的共享,其关键是数据集成。 数据集成技术,是要在多样的、独立的、异构的数据源中实现统一的和透明 的访问查询。数据集成的基本框架主要是由三个部分构成:全局模式、数据源以 及其间的映射。模式和模式间的语义映射关系是数据集成的基础。建立源模式与 中介模式之间的语义映射关系成为开发实际应用数据集成系统的关键所在。 一些基本概念[1] : 模式(schema)是数据库中全体数据的逻辑结构和特征的描述,它只涉及型 的描述,不涉及具体的值。 映射(mapping)是两个模式中有特定关系的规则集合,表示一个模式中某 些特定元素与另一个模式中特定元素的对应关系。一个映射关系包括两部分:映 射元素,映射元素间的关系的描述。Euzenat 把一个映射元素 M 定义为一个 5 元组: M = (eid, e, e′ , c, R), 其中 eid 是给定映射元素的唯一标识符;e 和e′ 分别是第一个和第二个模式中的 实体;c是e 和e′ 之间的一个数学置信度;R 表示e 和e′ 之间的关系(如相等、泛 化、不相交、相交等)。 模式匹配是指给定两个模式,利用一些相关信息,找到分布在两模式间的元 素间的某种映射关系(语义对应关系)。模式匹配将两个模式作为输入参数,其 输出结果是它们间的映射关系,即匹配结果;匹配结果中每个元素都表示成一个 输入模式中的某些元素和另外一个输入模式中的某些元素存在的逻辑上的对应 关系,即映射。 前面说过研究建立源模式与中介模式间的语义映射关系是数据集成的关键。 而由上面的基本概念可知源模式与中介模式间的语义映射关系可经模式匹配的结果得到。因此本论文重点介绍数据集成中的关键步骤模式匹配及关系代数在模 式匹配中的应用。 1.2 论文的主要工作 本论文讨论和分析了关系代数在数据集成中的应用,特别是关系代数在模式 匹配中解决语义冲突问题中的应用。主要工作归结为以下几点: (1)介绍了关系代数、数据集成、模式匹配基本概念及其存在的问题。 (2)总结了关系代数在解决全局模式与局部模式匹配过程中语义冲突的问题 中的应用。 1.3 论文组织 这篇文章中我首先给出了所要用到的基本概念,数据集成技术的大致介绍以 及模式匹配问题的讨论。然后在第三章详细介绍了关系代数在处理语义冲突中的 应用。最后总结全文。 2 关系代数及数据集成技术 2.1 关系代数[2,3] 关系代数是一种抽象的查询语言。它用对关系的运算来表达查询。关系代数 的运算对象是关系,运算结果亦为关系。关系的运算符包括四类:集合运算符, 专门的关系运算符,算数比较运算符和逻辑运算符。关系代数的运算按运算符的 不同可分为传统的集合运算和专门的关系运算两类。 2.1.1 传统的集合运算 传统的集合运算包括四种运算:并 设关系R与S具有相同的目 n,且相应的属性取自同一个域, t是元组变量, 表示t是 R的一个元组。 1.并(Union) 关系 R与S 的并记作 (责任编辑:qin) |