2023-04-17 16:08:16 92阅读
数据库体系结构分为 三级模式 + 两层映射关系,如下图
对于我们程序员/用户来说,我们看到的是数据库的用户视图,在外模式这个层,其数据来源是概念模式,所以有一个外模式-概念模式的映射(保证了逻辑独立性,即外部应用程序与概念模式中的基本表相互独立,如果有一方有变动,只需要修改映射表即可)
概念模式(又叫逻辑模式,简称模式),是数据库的核心,存储着基本表,包含了所有数据的逻辑结构和特征描述,基本表的内容映射了底层的文件,因此有 概念模式-内模式映射(保证了物理独立性,即内模式的物理程序发生变化的时候,应用程序也不需要发生变化,比如应用迁移的时候不需要改数据库,只要改映射即可)
内模式(又叫存储模式/物理模式)对应的是基本的存储文件
如果为关系型数据库,我们创建的都为关系表,关系表有三种类型:
数据库的视图:虚表,它的内容由查询来定义(仅保存sql查询语句),视图除了没有真实的存储这些数据(动态生成所需要的数据)之外,都跟真实的表一样(但是性能上看不是很好)
视图的优点:
如果视图存了下来,他就叫做物化视图,且原始表中的数据更新,物化视图也会更新(但更新太多了就影响性能了,因此它只适合多查询、少更新的情况)
分布式是对应集中式来说的,集中式数据库就是把数据放在一台机子上,但分布式数据库会放在不同的物理节点上,因此访问数据的时候就可以优先请求临近的节点,效率有所提升,也起到了一定的备份作用
分布式数据库的四大特性:
分部署数据库层次,一方面是有了全局和局部的区别(全局概念模式体现了数据的整体逻辑结构),另一方面是有了分片模式和分布模式
因此我们就有全局的DBMS、局部的DBMS,分布称为LDBMS、GBDMS,加起来我们称为DDBMS
分片的本质就是把一大堆数据切碎,这样方便放在不同的节点:
分片透明性:用户不需要关心数据是如何分片的
复制透明性:有些数据是会存多个副本的,而且需要不定期更新,但用户不需要关心
位置透明性:用户不需要知道数据具体放在哪个节点
逻辑透明性(局部映像透明性):用户不需要知道DBMS到底支持哪种数据模型/操作语言
分部署数据库的两阶段提交协议(2PC)
设计过程:
需求分析:参考 当前和未来应用的数据要求 + 数据处理要求,输出的是数据流图(数据的变换过程)、数据字典(数据的详细含义)和需求说明书
概念结构设计:参考的是需求分析的输出内容,是对现实世界的抽象,得到的是ER模型(实体关系图);与DBMS无关
逻辑结构设计:参考ER模型,输出的是数据模型,在关系型数据库中,这个数据模型为关系模式(又叫 关系表,基本表就参考这个来建立)
物理设计:完成对数据库相应分布形式、存储形式、访问形式的设计,要考虑硬件和操作系统的特性
ER图,是实体联系图,如下图:
实体与实体之间能够存在联系,同时实体/联系也有很多属性(特征值),同时不同的实体集之间也会有联系:
概念结构设计的步骤:
所谓的合并局部模型,就是集成多个ER图的过程,有两个方法:
解决冲突的办法:
关系模型的本质就是数据模型,数据模型有三个要素:
数据模型也可以大致分为四种:
比如,一个关系模型拥有四个属性:学生(学号,姓名,年龄,班级编号),他有以下几个重要属性:
关系模型的完整性约束:
主要就是把ER图转化为数据模型(关系模型),主要步骤如下图:
详细来说步骤如下:
ER图向关系模型的转换有一些比较固定的设计原则,以上图为例:
2023-04-17 16:08:16 92阅读
数据库体系结构分为 三级模式 + 两层映射关系,如下图
对于我们程序员/用户来说,我们看到的是数据库的用户视图,在外模式这个层,其数据来源是概念模式,所以有一个外模式-概念模式的映射(保证了逻辑独立性,即外部应用程序与概念模式中的基本表相互独立,如果有一方有变动,只需要修改映射表即可)
概念模式(又叫逻辑模式,简称模式),是数据库的核心,存储着基本表,包含了所有数据的逻辑结构和特征描述,基本表的内容映射了底层的文件,因此有 概念模式-内模式映射(保证了物理独立性,即内模式的物理程序发生变化的时候,应用程序也不需要发生变化,比如应用迁移的时候不需要改数据库,只要改映射即可)
内模式(又叫存储模式/物理模式)对应的是基本的存储文件
如果为关系型数据库,我们创建的都为关系表,关系表有三种类型:
数据库的视图:虚表,它的内容由查询来定义(仅保存sql查询语句),视图除了没有真实的存储这些数据(动态生成所需要的数据)之外,都跟真实的表一样(但是性能上看不是很好)
视图的优点:
如果视图存了下来,他就叫做物化视图,且原始表中的数据更新,物化视图也会更新(但更新太多了就影响性能了,因此它只适合多查询、少更新的情况)
分布式是对应集中式来说的,集中式数据库就是把数据放在一台机子上,但分布式数据库会放在不同的物理节点上,因此访问数据的时候就可以优先请求临近的节点,效率有所提升,也起到了一定的备份作用
分布式数据库的四大特性:
分部署数据库层次,一方面是有了全局和局部的区别(全局概念模式体现了数据的整体逻辑结构),另一方面是有了分片模式和分布模式
因此我们就有全局的DBMS、局部的DBMS,分布称为LDBMS、GBDMS,加起来我们称为DDBMS
分片的本质就是把一大堆数据切碎,这样方便放在不同的节点:
分片透明性:用户不需要关心数据是如何分片的
复制透明性:有些数据是会存多个副本的,而且需要不定期更新,但用户不需要关心
位置透明性:用户不需要知道数据具体放在哪个节点
逻辑透明性(局部映像透明性):用户不需要知道DBMS到底支持哪种数据模型/操作语言
分部署数据库的两阶段提交协议(2PC)
设计过程:
需求分析:参考 当前和未来应用的数据要求 + 数据处理要求,输出的是数据流图(数据的变换过程)、数据字典(数据的详细含义)和需求说明书
概念结构设计:参考的是需求分析的输出内容,是对现实世界的抽象,得到的是ER模型(实体关系图);与DBMS无关
逻辑结构设计:参考ER模型,输出的是数据模型,在关系型数据库中,这个数据模型为关系模式(又叫 关系表,基本表就参考这个来建立)
物理设计:完成对数据库相应分布形式、存储形式、访问形式的设计,要考虑硬件和操作系统的特性
ER图,是实体联系图,如下图:
实体与实体之间能够存在联系,同时实体/联系也有很多属性(特征值),同时不同的实体集之间也会有联系:
概念结构设计的步骤:
所谓的合并局部模型,就是集成多个ER图的过程,有两个方法:
解决冲突的办法:
关系模型的本质就是数据模型,数据模型有三个要素:
数据模型也可以大致分为四种:
比如,一个关系模型拥有四个属性:学生(学号,姓名,年龄,班级编号),他有以下几个重要属性:
关系模型的完整性约束:
主要就是把ER图转化为数据模型(关系模型),主要步骤如下图:
详细来说步骤如下:
ER图向关系模型的转换有一些比较固定的设计原则,以上图为例: