摘 要:随着计算机网络迅速发展,信息资源的异构性现象越来越突出。为了达到异构数据源间的共享,首先要解决数据集成问题。映射是数据集成的基础性问题,尚存在去重效率低,准确率低等问题。关系代数是关系数据库设计的理论基础,因此它与数据集成有许多内在联系。本毕业论文介绍关系代数与数据集成的基本内容,并结合两者间的联系着重探讨关系代数在数据集成中的应用。利用关系代数理论,研究建立源模式与中间模式之间的语义映射方法,并在此过程中提出解决模式匹配问题中语义冲突的方法。7080
关键词:关系代数;数据集成;模式匹配;模式映射;语义冲突;
Title Application of relational algebra in data integration
Abstract
With the rapid development of computer networks, the heterogeneity of
the phenomenon in information resources is becoming more prominent. In
order to achieve the purpose of sharing data among heterogeneous data
sources, firstly we must solve the data integration problem. Integrated
mapping is one of the basic issues in data integration, while it still has
some deficiencies such as low repetition reducing, lack of accuracy, etc.
The relational algebra is the theoretical basis of the design of relational
database, so there are many connections between relational algebra and data
integration. This article describes the basic theory of the relational
algebra and data integration, combined with the link between the two and
focuses on the application of relational algebra in data integration.
Relational algebra theory, research the semantic mapping between the
source-building mode and intermediate mode, and in this process of solving
model matching problem of semantic conflict.
Keywords Relational algebra Data integration Schema matching
Schema mapping Semantic conflict
目次
1 引言 1
1.1 研究背景 . 1
1.2 论文的主要工作 . 2
1.3 论文组织 2
2 关系代数及数据集成技术 2
2.1 关系代数 . 2
2.1.1 传统的集合运算 . 2
2.1.2 专门的关系运算 . 3
2.2 数据集成概述 . 4
2.2.1 数据集成方法 . 5
2.2.2 常见数据集成技术与标准 . 7
2.3 模式匹配技术综述 . 8
2.3.1 模式匹配问题 . 8
2.3.2 模式匹配的过程 . 9
2.3.3 模式匹配的方法 11
3 关系代数在处理语义冲突中的应用 . 13
3.1 语义匹配体系结构 14
3.2 模式中语义冲突问题的类型及解决方案 15
3.3 中间模式 17
3.4 语义相似性检测方法 19
3.4.1 属性的等价性 20
3.4.2 完整性约束等价性判定 21
3.4.3 依赖等价性判断 22
3.5 语义匹配规则 22
3.6 模式的合并于重构 24
结论 25
致谢 26
参考文献 27
1 引言
1.1 研究背景
近几十年来,信息技术的发展,使得人类社会所积累的数据量已近超过了过
去 5000 年的总和。数据的采集、存储、处理和传播的数量也与日俱增,各领域 关系代数在数据集成中的应用+文献综述:http://www.751com.cn/shuxue/lunwen_4845.html