电脑桌面
添加蜗牛文库到电脑桌面
安装后可以在桌面快捷访问

数据库期末复习总结

栏目:合同范文发布:2025-01-30浏览:1收藏

数据库期末复习总结

第一篇:数据库期末复习总结

数据库原理综合习题答案

1.1 名词解释

(1)DB:即数据库(Database),是统一管理的相关数据的集合。DB能为各种用户共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。

(2)DBMS:即数据库管理系统(Database Management System),是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。

(3)DBS:即数据库系统(Database System),是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。

(4)1:1联系:如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系,反之亦然,那么实体集E1对E2的联系称为“一对一联系”,记为“1:1”。

(5)1:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中的一个实体有联系,那么E1对E2的联系是“一对多联系”,记为“1:N”。

(6)M:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1对E2的联系是“多对多联系”,记为“M:N”。

(7)数据模型:模型是对现实世界的抽象。在数据库技术中,表示实体类型及实体类型间联系的模型称为“数据模型”。它可分为两种类型:概念数据模型和结构数据模型。

(6)概念数据模型:是独门于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构。

(9)结构数据模型:是直接面向数据库的逻辑结构,是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统,所以称为“结构数据模型”。结构数据模型应包含:数据结构、数据操作、数据完整性约束三部分。它主要有:层次、网状、关系三种模型。

(10)层次模型:用树型结构表示实体类型及实体间联系的数据模型。

(11)网状模型:用有向图结构表示实体类型及实体间联系的数据模型。

(12)关系模型:是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。关系模型是由若干个关系模式组成的集合。

(13)概念模式:是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。

(14)外模式:是用户与数据库系统的接口,是用户用到的那部

分数据的描述。

(15)内模式:是数据库在物理存储方面的描述,定义所有的内部记录类型、索引和文件的组成方式,以及数据控制方面的细节。

(16)模式/内模式映象:这个映象存在于概念级和内部级之间,用于定义概念模式和内模式间的对应性,即概念记录和内部记录间的对应性。此映象一般在内模式中描述。

(17)外模式/模式映象:这人映象存在于外部级和概念级之间,用于定义外模式和概念模式间的对应性,即外部记录和内部记录间的对应性。此映象都是在外模式中描述。

(18)数据独立性:在数据库技术中,数据独立性是指应用程序和数据之间相互独立,不受影响。数据独立性分成物理数据独立性和逻辑数据独立性两级。

(19)物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。

(20)逻辑数据独立性:如果数据库的概念模式要进行修改(如增加记录类型或增加数据项),那么外模式/模式映象也要进行相应的修改,使外模式尽可能保持不变。也就是对概念模式的修改尽量不影响外模式和应用程序。

(21)宿主语言:在数据库技术中,编写应用程序的语言仍然是一些高级程序设计语言,这些语言称为宿主语言(host language),简称主语言。

(22)DDL:数据定义语言(Data Definition Language),用于定义数据库的三级结构,包括外模式、概念模式、内模式及其相互之间的映象,定义数据的完整性、安全控制等约束。

(23)DML:数据操纵语言(Data Manipulation Language),由DBMS提供,用于让用户或程序员使用,实现对数据库中数据的操作。DML分成交互型DML和嵌入型DML两类。依据语言的级别,DML又可分成过程性DML和非过程性DML两种。

(24)交互型DML:如果DML自成系统,可在终端上直接对数据库进行操作,这种DML称为交互型DML。

(25)嵌入型DML:如果DML嵌入在主语言中使用,此时主语言是经过扩充能处理DML语句的语言,这种DML称为嵌入型DML。

(26)过程性DML:用户编程时,不仅需要指出“做什么”(需要什么样的数据),还需要指出“怎么做”(怎么获得数据)。层状、网状的DML属于过程性语言。

(27)非过程性DML:用户编程时,只需要指出“做什么”,不需要指出“怎么做”。

Notice:以上关于DML的各个概念单独出现时,首先要解释DML的含义。

(28)DD:数据字典(Data Dictionary),数据库系统中存放三级结构定义的数据库称为数据字典。对数据库的操作都要通过访问DD才能实现。

(29)DD系统:管理DD的实用程序称为“DD系统”。

1.2 文件系统阶段的数据管理有些什么缺陷?试举例说明。

文件系统有三个缺陷:

(1)数据冗余性(redundancy)。由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。

(2)数据不一致性(inconsistency)。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。

(3)数据联系弱(poor data relationship)。这是由文件之间相互独立,缺乏联系造成的。

1.3 数据库阶段的数据管理有些什么特点?

(1)采用复杂的数据模型表示数据结构

(2)有较高的数据独立性(数据结构分成用户的逻辑结构、整体逻辑结构和物理结构三级)

(3)数据库系统为用户提供方便的用户接口,可以使用查询语言、终端命令或程序方式操作数据,也可以用程序方式操作数据库。

(4)系统提供了四个方面的数据控制功能:数据库的恢复、并发控制、数据完整性和数据安全性,以保证数据库中数据是安全的、正确的和可靠的。

(5)对数据的操作不一定以记录为单位,还可以数据项为单位,增加了系统的灵活性。

1.4 你怎样理解实体、属性、记录、字段这些概念的类型和值的差别?试举例说明。

实体(entity):是指客观存在可以相互区别的事物。实体可以是具体的对象,如:一个学生,一辆汽车等;也可以是抽象的事件,如:一次借书、一场足球赛等。

属性(attribute):实体有很多特性,每一个特性称为属性。每个属性有一个值域,其类型可以是整数型、实数型、字符串型。比如,学生(实体)有学号、姓名、年龄、性别等属性,相应值域为字符、字符串、整数和字符串型。

字段(field):标记实体属性的命名单位称为字段或数据项。它是可以命名的最小信息单位,所以又称为数据元素或初等项。字段的命名往往和属性名相同,比如,学生有学号、姓名、年龄、性别等字段。

记录(record):字段的有序集合称为记录。一般用一个记录描述一个实体,所以记录又可以定义为能完整地描述一个实体的字段集。如:一个学生记录,由有序的字段集(学号、姓名、年龄、性别等)组成。

1.5 逻辑记录与物理记录,逻辑文件与物理文件有些什么联系和区别?

联系:

(1)逻辑记录与物理记录都是记录,是字段的有序集合;

(2)逻辑文件与物理文件都是文件,是同一类记录的汇集。

区别:

(1)逻辑记录与逻辑文件是逻辑数据描述,物理记录与物理文件是物理数据描述。

(2)物理数据描述是指数据在存储设备上的存储方式,物理记录、物理文件(还有物理联系、物理结构等术语),都是用来描述实际存储设备上的数据。

(3)逻辑数据描述是指程序员或用户用以操作的数据形式,是抽象的概念化数据。逻辑记录、逻辑文件(还有逻辑联系、逻辑结构等术语),都是用户观点的数据描述。

1.6 为某百货公司设计一个ER模型。

百 货管辖若干个连锁商店,每家商店经营若干商品,每家商店有若干职工,但每个职工只能服务于一家商店。实体类型“商店”的属性有:商店编号,店名,店址,店经理。实体类型“商品”的属性有:商品编号,商品名,单价,产地。实体类型“职工”的属性有:职工编号,职工名,性别,工资。在联系中应反映出职工参加某商店工作的开始时间,商店销售商品的月销售量。

试画出反映商店、商品、职工实体类型及联系类型的ER图,并将其转换成关系模式集。

实体:商店(商店编号,店名,店址,店经理)

商品(商品编号,商品名,单价,产地)

职工(职工编号,职工名,性别,工资)

联系:SC(商店—商品之间1:N的联系,联系属性为“职工参加商店工作的开始时间”。

SE(商店—职工之间1:N的联系),联系属性为“月销售量”。

关系模式集:商店模式(商店编号,店名,店址,店经理)

商品模式(商品编号,商品名,单价,产地,商店编号,月销售量)

职工模式(职工编号,职工名,性别,工资,商店编号,开始时间)

1.7 试述ER模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。

ER模型的主要特点:

(1)优点:接近于人的思维,容易理解;与计算机无关,用户容易接受。

(2)缺点:只能说明实体间语义的联系,不能进一步说明详细的数据结构。

层次模型的特点:

(1)优点:记录之间的联系通过指针实现,查询效率较高。

(2)缺点:只能表示1:N联系,实现M:N结构较复杂;由于层次顺序的严格和复杂,引起数据的查询和更新操作也很复杂。

网状模型的特点:

(1)优点:记录之间联系通过指针实现,M:N联系也容易实现(每个M:N联系可拆成两个1:N联系),查询效率较高。

(2)缺点:编写应用程序比较复杂,程序员必须熟悉数据库的逻辑结构。

关系模型的特点:

用关鍵码而不是用指针导航数据,表格简单,用户易懂,编程时并不涉及存储结构、访问技术等细节。

1.8 试述概念模式在数据库结构中的重要地位。

概念模式是数据库中

全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供了连接这两级的相对稳定的中间观点,并使得两级的任何一级的改变都不受另一级的牵制。

1.9 数据独立性与数据联系这两个概念有什么区别?

数据独立性是指应用程序与数据之间相互独立,不受影响。

数据联系是指同一记录内部各字段间的联系,以及记录之间的联系。

1.10 试述DBMS在用户访问数据库过程中所起的作用.用户对数据库进行操作,DBMS把操作从应用程序带到外部级、概念级、再导向内部级,进而操作存储器中的数据。

(结合P22“用户访问数据的过程”来理解)

1.11 试述DBMS的主要功能。

DBMS的主要功能有:

(1)数据库的定义功能

(2)数据库的操纵功能

(3)数据库的保护功能

(4)数据库的存储管理

(5)数据库的维护功能

(6)数据字典

1.12 试叙DBMS对数据库的保护功能。

DBMS对数据库的保护主要通过四个方面实现:

(1)数据库的恢复。

(2)数据库的并发控制。

(3)数据库的完整性控制。

(4)数据库的安全性控制。

1.13 试叙DBMS对数据库的维护功能。

DBMS中有一些程序提供给数据库管理员运行数据库系统时使用,这些程序起着数据库维护的功能。

主要有四个实用程序:

(1)数据装载程序(loading)

(2)备份程序(backup)

(3)文件重组织程序

(4)性能监控程序

1.14 从模块结构看,DBMS由哪些部分组成?

从模块结构看,DBMS由两大部分组成:查询处理器和存储管理器

(1)查询处理器有四个主要成分:DDL编译器,DML编译器,嵌入型DML的预编译器,查询运行核心程序

(2)存储管理器有四个主要成分:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器

(以上几题具体可参照书上p20-21)

1.15 DBS由哪几个部分组成?

DBS由四部分组成:数据库、硬件、软件、数据库管理员。

1.16 什么样的人是DBA?DBA应具有什么素质?DBA的职责是什么?

DBA是控制数据整体结构的人,负责DBS的正常运行。DBA可以是一个人,在大型系统中也可以是由几个人组成的小组。DBA承担创建、监控和维护整个数据库结构的责任。

DBA应具有下列素质:

(1)熟悉企

业全部数据的性质和用途;

(2)对用户的需求有充分的了解;

(3)对系统的性能非常熟悉。

DBA的主要职责有五点:

(1)概念模式定义

(2)内模式定义

(3)根据要求修改数据库的概念模式和内模式

(4)对数据库访问的授权

(5)完整性约束的说明

1.17 试对DBS的全局结构作详细解释。

参照教材p24-25。

1.18 使用DBS的用户有哪几类? 使用DBS的用户有四类:

1)DBA

2)专业用户

3)应用程序员

4)最终用户

1.19 DBMS的查询处理器有哪些功能?

DBMS的查询处理器可分成四个成分:

1)DML编译器

2)嵌入型DML的预编译器

3)DDL编译器

4)查询运行核心程序

(各成分功能参照P24)

1.20 DBMS的存储处理器有哪些功能?

DBMS的存储处理器提供了应用程序访问数据库中数据的界面,可分成四个成分:

1)授权和完整性管理器

2)事务管理器

3)文件管理器

4)缓冲区管理器

(各成分功能参照P25)

1.21 磁盘存储器中有哪四类主要的数据结构?

数据文件:存储了数据库中的数据;

数据字典(DD):存储三级结构的描述;

索引文件:为提高查询速度而设置的逻辑排序手段;

统计数据组织:存储DBS运行时统计分析数据。

(1)关系模型:用二维表格结构表示实体集,外键表示实体间联系的数据模型称为关系模型。

(2)关系模式:关系模式实际上就是记录类型。它的定义包括:模式名,属性名,值域名以及模式的主键。关系模式不涉及到物理存储方面的描述,仅仅是对数据特性的描述。

(3)关系实例:元组的集合称为关系和实例,一个关系即一张二维表格。

(4)属性:实体的一个特征。在关系模型中,字段称为属性。

(5)域:在关系中,每一个属性都有一个取值范围,称为属性的值域,简称域。

(6)元组:在关系中,记录称为元组。元组对应表中的一行;表示一个实体。

(7)超键:在关系中能唯一标识元组的属性集称为关系模式的超键。

(8)候选键:不含有多余属性的超键称为候选键。

(9)主键:用户选作元组标识的一个候选键为主键。(单独出现,要先解释“候选键”)

(10)外键:某个关系的主键相应的属性在另一关系中出现,此时该主键在就是另一关系的外键,如有两个关系S和SC,其中S#是关系S的主键,相应的属性S#在关系SC中也出现,此时S#就是关系SC的外键。

(11)实体完整性规则:这条

规则要求关系中元组在组成主键的属性上不能有空值。如果出现空值,那么主键值就起不了唯一标识元组的作用。

(12)参照完整性规则: 这条规则要求“不引用不存在的实体”。其形式定义如下:如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么R2的关系中,K的取值只允许有两种可能,或者为空值,或者等于R1关系中某个主键值。这条规则在使用时有三点应注意: 1)外键和相应的主键可以不同名,只要定义在相同值域上即可。2)R1和R2也可以是同一个关系模式,表示了属性之间的联系。3)外键值是否允许空应视具体问题而定。

(13)过程性语言:在编程时必须给出获得结果的操作步骤,即“干什么”和“怎么干”。如Pascal和C语言等。

(14)非过程性语言:编程时只须指出需要什么信息,不必给出具体的操作步骤。各种关系查询语言均属于非过程性语言。

(15)无限关系:当一个关系中存在无穷多个元组时,此关系为无限关系。如元组表达式{t|┐R(t)}表示所有不在关系R中的元组的集合,这是一个无限关系。

(16)无穷验证:在验证公式时需对无穷多个元组进行验证就是无穷验证。如验证公式(u)(P(u))的真假时需对所有的元组u进行验证,这是一个无穷验证的问题。

2.2 为什么关系中的元组没有先后顺序?

因为关系是一个元组的集合,而元组在集合中的顺序无关紧要。因此不考虑元组间的顺序,即没有行序。

2.3 为什么关系中不允许有重复元组?

因为关系是一个元组的集合,而集合中的元素不允许重复出现,因此在关系模型中对关系作了限制,关系中的元组不能重复,可以用键来标识唯一的元组。

2.4 关系与普通的表格、文件有什么区别?

关系是一种规范化了的二维表格,在关系模型中,对关系作了下列规范性限制:

1)关系中每一个属性值都是不可分解的。

2)关系中不允许出现相同的元组(没有重复元组)。

3)由于关系是一个集合,因此不考虑元组间的顺序,即没有行序。

4)元组中,属性在理论上也是无序的,但在使用时按习惯考虑列的顺序。

2.5 笛卡尔积、等值联接、自然联接三者之间有什么区别?

笛卡尔积对两个关系R和S进行乘操作,产生的关系中元组个数为两个关系中元组个数之积。

等值联接则是在笛卡尔积的结果上再进行选择操作,从关系R和S的笛卡儿积中选择对应属性值相等的元组;

自然连接则是在等值联接(以所有公共属性值相等为条件)的基础上再行投影操作,并去掉重复的公共属性列。当两个关系没有公共属性时,自然连接就转化我笛卡尔积。

2.8 如果R是二元关

系,那么下列元组表达式的结果是什么? {t|(u)(R(t)∧R(u)∧(t[1]≠u[1]∨t[2]≠u[2]))}

这个表达式的意思是:从关系R中选择元组,该元组满足:第1分量值或第2分量值至少有一个不等于其他某元组。由于R是二元关系,只有两个分量,由于没有重复元组,上述条件显然满足。所以,这个表达式结果就是关系R。

2.9 假设R和S分别是三元和二元关系,试把表达式π1,5(σ2=4∨3=4(R×S))转换成等价的:(1)汉语查询句子;(2)元组表达式;(3)域表达式。

(1)汉语表达式:

从R×S关系中选择满足下列条件的元组:

第2分量(R中第2分量)与第4分量(S中第1分量)值相等,或第3分量(R中第3分量)与第4分量(S中第1分量)值相等;并取第1列与第5列组成的新关系。

(2)元组表达式:{t|(u)(v)(R(u)∧S(v)∧(u[2]=v[1]∨u[3]=v[1])∧t[1]=u[1]∧t[2]=v[2])}(3)域表达式:{xv|(y)(z)(u)(R(xyz)∧S(uv)∧(y=u∨z=u))}

2.10 假设R和S都是二元关系,试把元组表达式{t|R(t)∧(u)(S(u)∧u[1]≠t[2])}转换成等价的:(1)汉语查询句子;(2)域表达式:(3)关系代数表达式。

(1)汉语表达式:选择R关系中元组第2分量值不等于S关系中某元组第1分量值的元组。

(2)域表达式:{xy|(u)(v)(R(xy)∧S(uv)∧(u≠y))}(3)关系代数表达式:π1,2(σ2≠3(R×S))

2.11 试把域表达式{ab|R(ab)∧R(ba)}转换成等价的:

(1)汉语查询句子;(2)关系代数表达式;(3)元组表达式。

(1)汉语查询句子:选择R中元组第1分量值与第2分量值互换后仍存在于R中的元组。

(2)关系代数表达式:π1,2(σ1=4∧2=3(R×R));

(3)元组表达式:{t|(u)(R(t)∧R(u)∧t[1]=u[2]∧t[2]=u[1])}

试用关系代数表达式表示下列查询语句。(见下一题)

2.14 试用元组表达式表示上题中各个查询语句。

(1)检索LIU老师所授课程的课程号、课程名。

πC#,CNAME(σTEACHER='LIU'(C))

{t|(u)(C(u)∧C[3]='LIU'∧t[1]=u[1]∧t[2]=u[2])}

(2)检索年龄大于23岁的男学生的学号与姓名。

πS#,SNAME(σAGE>'23'∧SEX='男'(S))

{t|(u)(S(u)∧u[3]>'23'∧u[4]='男'∧t[1]=u[1]∧t[2]=u[2])}

(3)检索学号为S3学生所学课程的课程名与任课教师名。πCNAME,TEACHER(σS#='S3'(SCC))

{t|(u)(v)(SC(u)∧C(v)∧u[1]='S3'∧v[1]=u[2]∧t[1]=v[2]∧t[2]=v[3])}

(4)检索至少选修LIU老

师所授课程中一门课程的女学生的姓名。

πSNAME(σSEX='女'∧TEACHER='LIU'(SSCC))

{t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[4]='女'∧v[1]=u[1]∧v[2]=w[1]∧w[3]='LIU'∧t[1]=u[2])}

(5)检索WANG同学不学的课程号。

πC#(C)-πC#(σSNAME='WANG'(SSC))

或者,πC#(SC)-πC#(σSNAME='WANG'(SSC))(全部课程号减去WANG同学所学的课程号){t|(u)(v)(C(u)∧SC(v)∧(u[1]=v[2]=>(w)(s(w)∧w[1]=v[1]∧W[2]≠'wang'))∧t[1]=u[1])}

(从C中选择满足条件的元组:SC中的所有元组,如果学号与C中所选元组相同的话,其在S中对应的姓名肯定不是'wang'。)

Notice:“p1=>p2”的含义是:如果p1为真,则p2为真。

(6)检索至少选修两门课程的学生学号。

πS#(σ1=4∧2≠5(SC×SC))

SC自乘之后,再选择(同一个学号中两个课程号不同的元组),投影。

{t|(u)(v)(SC(u)∧SC(v)∧u[1]=v[1]∧u[2]≠v[2])∧t[1]=u[1]}

(7)检索全部学生都选修的课程的课程号与课程名。

πC#,CNAME(C(πS#,C#(SC)÷πS#(S)))(涉及到全部值时,应用除法,“除数”是“全部”){t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[1]=v[1]∧v[2]=w[1]∧t[1]=v[1]∧t[2]=V[2])}

(8)检索选修课程包含LIU老师所授课程的学生学号。

πS#(σTEACHER='LIU'(SCC))

{t|(u)(v)(SC(u)∧C(v)∧u[2]=v[1]∧v[3]='LIU'∧t[1]=u[1])}

如果LIU老师有多门课程,则选修课程包含LIU老师所授全部课程的学生学号为:

πS#,C#(SC)÷πC#(σTEACHER='LIU'(C))

2.15 在教学数据库S、SC、C中,用户有一查询语句:检索女同学选修课程的课程名和任课教师名。(1)试写出该查询的关系代数表达式;(2)试写出查询优化的关系代数表达式。

(1)πCNAME,TEACHER(σSEX='女'(SSCC))

(2)优化为:πCNAME,TEACHER(CπC#(πS#,C#(SC)πS#(σSEX='女'(S))))

(基本思路:尽量提前做选择操作;在每个操作后,应做个投影操作,去掉不用的属性值。

2.16 在2.15题中,(1)画出该查询初始的关系代数表达式的语法树。

(2)使用2.4.4节的优化算法,对语法树进行优化,并画出优化后的语法树。

该查询初始的关系代数表达式的语法树

优化后的语法树

2.17 为什么要对关系代数表达式进行优化?

在关系代数运算中,各个运算所费时间和空间是不一样的。如何安排若干关系的运算操作步骤,直接影响到整个操作所需要的时间和空间。对关系代数表达式进行优化,可以提高系统的操作效率,达到执行过程即省时间又省空间的目的。

3.1 名词解释

(1)SQL模式:SQL模式是表和授权的静态定义。一个SQL模式定义为基本表的集合。一个由模式名和模式拥有者的用户名或账号来确定,并包含模式中每一个元素(基本表、视图、索引等)的定义。

(2)SQL数据库:SQL(Structured Query Language),即‘结构

式查询语言’,采用英语单词表示和结构式的语法规则。一个SQL数据库是表的汇集,它用一个或多个SQL模式定义。

(3)基本表:在SQL中,把传统的关系模型中的关系模式称为基本表(Base Table)。基本表是实际存储在数据库中的表,对应一个关系。

(4)存储文件:在SQL中,把传统的关系模型中的存储模式称为存储文件(Stored File)。每个存储文件与外部存储器上一个物理文件对应。

(5)视图:在SQL中,把传统的关系模型中的子模式称为视图(View),视图是从若干基本表和(或)其他视图构造出来的表。

(6)行:在SQL中,把传统的关系模型中的元组称为行(row)。

(7)列:在SQL中,把传统的关系模型中的属性称为列(coloumn)。

(8)实表:基本表被称为“实表”,它是实际存放在数据库中的表。

(9)虚表:视图被称为“虚表”,创建一个视图时,只把视图的定义存储在数据词典中,而不存储视图所对应的数据。

(10)相关子查询:在嵌套查询中出现的符合以下特征的子查询:子查询中查询条件依赖于外层查询中的某个值,所以子查询的处理不只一次,要反复求值,以供外层查询使用。

(11)联接查询:查询时先对表进行笛卡尔积操作,然后再做等值联接、选择、投影等操作。联接查询的效率比嵌套查询低。

(12)交互式SQL:在终端交互方式下使用的SQL语言称为交互式SQL。

(13)嵌入式SQL:嵌入在高级语言的程序中使用的SQL语言称为嵌入式SQL。

(14)共享变量:SQL和宿主语言的接口。共享变量有宿主语言程序定义,再用SQL的DECLARE语句说明,SQL语句就可引用这些变量传递数据库信息。

(15)游标:游标是与某一查询结果相联系的符号名,用于把集合操作转换成单记录处理方式。

(16)卷游标:为了克服游标在推进时不能返回的不便,SQL2提供了卷游标技术。卷游标在推进时不但能沿查询结果中元组顺序从头到尾一行行推进,也能一行行返回。

3.2 对于教学数据库的三个基本表

学生 S(S#,SNAME,AGE,SEX)

学习SC(S#,C#,GRADE)

课程 C(C#,CNAME,TEACHER)

试用SQL的查询语句表达下列查询:

(1)检索LIU老师所授课程的课程号和课程名。

SELECT C#,CNAME

FROM C

WHERE TEACHER=‘LIU’

(2)检索年龄大于23岁的男学生的学号和姓名。

SELECT S#,SNAME

FROM S

WHERE(AGE>23)AND(SEX=‘M’)

(3)检索至少选修LIU老师所授课程中一门课程的女学生姓名。

SELECT SNAME

FROM S

WHERE SEX=‘F’ AND S# IN

(SELECT S#

FROM SC

WHERE C# IN

(SELECT C#

OM C

WHERE TEACHER=‘LIU’)

NOTICE:有多种写法,比如联接查询写法:

SELECT SNAME

FROM S,SC,C

WHERE SEX=‘F’ AND SC.S#=S.S#

AND SC.C#=C.C#

AND TEACHER='LIU' 但上一种写法更好一些。

(4)检索WANG同学不学的课程的课程号。

SELECT C#

FROM C

WHERE C# NOT IN

(SELECT C#

FROM SC

WHERE S# IN

(SELECT S#

FROM S

WHERE SNAME='WANG'))

FR

(5)检索至少选修两门课程的学生学号。

SELECT DISTINCT X.SNO

FROM SC X,SC Y

WHERE X.SNO=Y.SNO AND X.CNO<>Y.CNO Notice:对表SC进行自连接,X,Y是SC的两个别名。

(6)检索全部学生都选修的课程的课程号与课程名。

SELECT C#,CNAME

FROM C

WHERE NOT EXISTS

(SELECT *

FROM S

WHERE S# NOT IN

(SELECT *

FROM SC

WHERE SC.C#=C.C#))

要从语义上分解:(1)选择课程的课程号与课程名,不存在不选这门课的同学。

其中,“不选这门课的同学”可以表示为:

SELECT *

FROM S

WHERE S# NOT IN

(SELECT *

FROM SC

WHERE SC.C#=C.C#)

或者

SELECT *

FROM S

WHERE

NOT EXISTS

(SELECT *

FROM SC

WHERE S.S#=C.S# AND

SC.C#=C.C#)

(7)检索选修课程包含LIU老师所授课的学生学号。

SELECT DISTINCT S#

FROM SC

WHERE C# IN

(SELECT C#

FROM C

WHERE TEACHER='LIU'))

3.3 设有两个基本表R(A,B,C)和S(D,E,F),试用SQL查询语句表达下列关系代数表达式:

(1)πA(R)

(2)σB='17'(R)

(3)R×S

(4))πA,F(σC=D(R×S))(1)SELECT A FROM R

(2)SELECT * FROM R WHERE B='17'(3)SELECT A,B,C,D,E,F FROM R,S

(4)SELECT A,F FROM R,S WHERE R.C=S.D

3.4 3.4 设有两个基本表R(A,B,C)和S(A,B,C)试用SQL查询语句表达下列关系代数表达式:

(1)R∪S

(2)R∩S

(3)R-S

(4)πA,B(R)πB,C(S)

(1)SELECT A,B,C

FROM R

UNION

SELECT A,B,C

FROM S

(2)SELECT A,B,C

FROM R

INTERSECT

SELECT A,B,C

FROM S

(3)SELECT A,B,C

FROM R

WHERE NOT EXISTS

(SELECT A,B,C

FROM S

WHERE R.A=S.A AND R.B=S.B AND R.C=S.C)

(4)SELECT R.A,R.B,S.C

FROM R,S

WHE

RE R.B=S.B

3.5 试叙述SQL语言的关系代数特点和元组演算特点。

(P61-62)

3.6 试用SQL查询语句表达下列对教学数据库中三个基本表S、SC、C的查询:

(1)统计有学生选修的课程门数。

SELECT COUNT(DISTINCT C#)FROM SC

(2)求选修C4课程的学生的平均年龄。

SELECT AVG(AGE)

FROM S

WHERE S# IN

(SELECT S#

FROM SC

WHERE C#='C4')或者,SELECT AVG(AGE)

FROM S,SC

WHERE S.S#=SC.S# AND C#='004'

(3)求LIU老师所授课程的每门课程的学生平均成绩。

SELECT CNAME,AVG(GRADE)

FROM SC ,C

WHERE SC.C#=C.C# AND TEACHER='LIU'

GROUP BY C#

(4)统计每门课程的学生选修人数(超过10人的课程才统计)。要求输出课程号和选修人数,查询结果按人数降序排列,若人数相同,按课程号升序排列。

SELECT DISTINCT C#,COUNT(S#)

FROM SC

GROUP BY C#

HAVING COUNT(S#)>10

ORDER BY 2 DESC, C# ASC

(5)检索学号比WANG同学大,而年龄比他小的学生姓名。

SELECT X.SNAME

FROM S AS X, S AS Y

WHERE Y.SNAME='WANG' AND X.S#>Y.S# AND X.AGE

(6)检索姓名以WANG打头的所有学生的姓名和年龄。

SELECT SNAME,AGE

FROM S

WHERE SNAME LIKE 'WANG%'

(7)在SC中检索成绩为空值的学生学号和课程号。

SELECT S#,C#

FROM SC

WHERE GRADE IS NULL

(8)求年龄大于女同学平均年龄的男学生姓名和年龄。

SELECT SNAME,AGE

FROM S AS X

WHERE X.SEX='男' AND X.AGE>(SELECT AVG(AGE)FROM S AS Y WHERE Y.SEX='女')

(9)求年龄大于所有女同学年龄的男学生姓名和年龄。

SELECT SNAME,AGE

FROM S AS X

WHERE X.SEX='男' AND X.AGE>ALL(SELECT AGE FROM S AS Y WHERE Y.SEX='女')

3.7 试用SQL更新语句表达对教学数据库中三个基本表S、SC、C的各个更新操作:

(1)往基本表S中插入一个学生元组(‘S9’,‘WU’,18)。

INSERT INTO S(S#,SNAME,AGE)VALUES('59','WU',18)

(2)在基本表S中检索每一门课程成绩都大于等于80分的学生学号、姓名和性别,并把检索到的值送往另一个已存在的基本表STUDENT(S#,SANME,SEX)。

INSERT INTO STUDENT(S#,SNAME,SEX)

SELECT S#,SNAME,SEX

FROM S WHERE NOT EXISTS

(SELECT * FROM SC WHERE

GRADE<80 AND S.S#=SC.S#)

(3)在基本表SC中删除尚无成绩的选课元组。

DELETE FROM SC

WHERE GRADE IS NULL(4)把WANG同学的学习选课和成绩全部删去。

DELE

TE FROM SC

WHERE S# IN

(SELECT S#

FROM S

WHERE SNAME='WANG')

(5)把选修MATHS课不及格的成绩全改为空值。

UPDATE SC

SET GRADE=NULL

WHERE GRADE<60 AND C# IN

(SELECT C#

FROM C

WHERE CNAME='MATHS')

(6)把低于总平均成绩的女同学成绩提高5%。

UPDATE SC

SET GRADE=GRADE*1.05

WHERE GRADE<(SELECT AVG(GRADE)FROM SC)AND S# IN(SELECT S# FROM S WHERE SEX='F')

(7)在基本表SC中修改C4课程的成绩,若成绩小于等于75分时提高5%,若成绩大于75分时提高4%(用两个UPDATE语句实现)。

UPDATE SC

SET GRADE=GRADE*1.05

WHERE C#='C4' AND GRADE<=75

UPDATE SC

SET GRADE=GRADE*1.04

WHERE C#='C4' AND GRADE>75

3.8 在第1章例1.4中提到“仓库管理”关系模型有五个关系模式:

零件 PART(P#,PNAME,COLOR,WEIGHT)

项目 PROJECT(J#,JNAME,DATE)

供应商 SUPPLIER(S#,SNAME,SADDR)

供应 P_P(J#,P#,TOTOAL)

采购 P_S(P#,S#,QUANTITY)

(1)试用SQL DDL语句定义上述五个基本表,并说明主键和外键。

CREATE TABLE PART

(P# CHAR(4)NOT NULL,PNAME CHAR(12)NOT NULL,COLOR CHAR(10),WEIGHT REAL,PRIMARY KEY(P#))

CREATE TABLE PROJECT

(J# CHAR(4)NOT NULL,JNAME CHAR(12)NOT NULL,DATE DATE,PRIMARY KEY(J#))

CREATE TABLE SUPLIER

(S# CHAR(4)NOT NULL,SNAME CHAR(12),SADDR VARCHAR(20),PRIMARY KEY(S#))

CREATE TABLE P_P

(J# CHAR(4),P# CHAR(4),TOTAL INTEGER,PRIMARY KEY(J#,P#),FOREIGN KEY(J#)REFERENCE PROJECT(J#),FOREIGN KEY(P#)REFERENCE PART(P#))

CREATE TABLE P_S

(P# CHAR(4),S# CHAR(4),QUANTITY INTEGER,PRIMARY KEY(P#,S#),FOREIGN KEY(P#)REFERENCE PART(P#),FOREIGN KEY(S#)REFERENCE SUPLIER(S#))

(2)试将PROGECT、P_P、PART三个基本表的自然联接定义为一个视图VIEW1,PART、P_S、SUPPLIER 三个基本表的自然联接定义为一个视图VIEW2。

CREATE VIEW VIEW1(J#,JNAME,DATE,P#,PNAME,COLOR,WEIGHT,TOTAL)

AS SELECT PROJECT.J#,JNAME,DATE,PART.P#,PNAME,COLOR,WEIGHT,TOTAL

FROM PROJECT,PART,P_P

WHERE PART.P#=P_P.P# AND P_P.J#=PROJECT.J

#CREATE VIEW VIEW2(P#,PNAME,COLOR,WEIGHT,S#,SNAME,SADDR,QUANTITY)

AS SELECT PART.P#,PNAME,COLOR,WEIGHT,SUPPLIER.S#,SNAME,SADDR,QUA

NTITY

FROM PART,P_S,SUPPLIER

WHERE PART.P#=P_S.P# AND P_S.S#=SUPPLIER.S#

(3)试在上述两个视图的基础上进行数据查询:

1)检索上海的供应商所供应的零件的编号和名字。

SELECT P#,PNAME FROM VIEW2 WHERE SADDR='SHANGHAI'

2)检索项目J4所用零件的供应商编号和名字。

SELECT S#,SNAME FROM VIEW2 WHERE P# IN(SELECT P# FROM VIEW1 WHERE J#='J4')

3.9 对于教学数据库中基本表SC,已建立下列视图:

CREATE VIEW S_GRADE(S#,C_NUM,AVG_GRADE)

AS SELECT S#,COUNT(C#),AVG(GRADE)

FROM SC

GROUP BY S#

试判断下列查询和更新是否允许执行。若允许,写出转换到基本表SC上的相应操作。

(1)SELECT *

FROM S_GRADE

允许

SELECT S#,COUNT(C#),AVG(GRADE)FROM SC GROUP BY S#

(2)SELECT S#,C_NUM

FROM S_GRADE

WHERE AVG_GRADE>80

允许

SELECT S#,COUNT(C#)FROM SC WHERE AVG(GRADE)>80

(3)SELECT S#,AVG_GRADE

FROM S_GRADE

WHERE C_NUM>(SELECT C_NUM

FROM S_GRADE

WHERE S#=‘S4’)

允许

SELECT S#,AVG(GRADE)

FROM SC AS X

WHERE COUNT(X.C#)>(SELECT COUNT(Y.C#)FROM SC AS Y WHERE Y.S#='S4')

GROUP BY S#

(4)UPDATE S_GRADE

SET C_NUM=C_NUM+1

WHERE S#=‘S4’

不允许

(5)DELETE FROM S_GRADE

WHERE C_NUM>4

不允许

3.10 预处理方式对于嵌入式SQL的实现有什么重要意义?

预处理方式是先用预处理程序对源程序进行扫描,识别出SQL语句,并处理成宿主语言的函数调用形式;然后再用宿主语言的编译程序把源程序编译成目标程序。这样,不用扩充宿主语言的编译程序,就能处理SQL语句。

3.11 在宿主语言的程序中使用SQL语句有哪些规定?

在宿主语言的程序中使用SLQ语句有以下规定:

(1)在程序中要区分SQL语句与宿主语言语句

(2)允许嵌入的SQL语句引用宿主语言的程序变量(称为共享变量),但有两条规定:

1)引用时,这些变量前必须加“:”作为前缀标识,以示与数据库中变量有区别。

2)这些变量由宿主语言的程序定义,并用SQL的DECLARE语句说明。

(3)SQL的集合处理方式与宿主语言单记录处理方式之间要协调。需要采用

游标机制,把集合操作转换成单记录处理方式。

3.12 SQL的集合处理方式与宿主语言单记录处理方式之间如何协调?

由于SQL语句处理的是记录集合,而宿主语言语句一次只能处理一个记录,因此需要用游标(cousor)机制,把集合操作转换成单记录处理方式。

2.13 嵌入式SQL语句何时不必涉及到游标?何时必须涉及到游标?

(1)INSERT、DELETE、UPDATE语句,查询结果肯定是单元组时的SELECT语句,都可直接嵌入在主程序中使用,不必涉及到游标。

(2)当SELECT语句查询结果是多个元组时,此时宿主语言程序无法使用,一定要用游标机制把多个元组一次一个地传送给宿主语言处理。

4.1 名词解释

(1)函数依赖:FD(function dependency),设有关系模式R(U),X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y], 则称X函数决定Y,或Y函数依赖于X,记为X→Y。X→Y为模式R的一个函数依赖。

(2)函数依赖的逻辑蕴涵:设F是关系模式R的一个函数依赖集,X,Y是R的属性子集,如果从F中的函数依赖能够推出X→Y,则称F逻辑蕴涵X→Y,记为F|=X→Y。

(3)部分函数依赖:即局部依赖,对于一个函数依赖W→A,如果存在XW(X包含于W)有X→A成立,那么称W→A是局部依赖,否则称W→A为完全依赖。

(4)完全函数依赖:见上。

(5)传递依赖:在关系模式中,如果Y→X,X→A,且XY(X不决定Y),AX(A不属于X),那么称Y→A是传递依赖。

(6)函数依赖集F的闭包F+: 被逻辑蕴涵的函数依赖的全体构成的集合,称为F的闭包(closure),记为F+。

(7)1NF: 第一范式。如果关系模式R的所有属性的值域中每一个值都是不可再分解的值, 则称R是属于第一范式模式。如果某个数据库模式都是第一范式的,则称该数据库存模式属于第一范式的数据库模式。第一范式的模式要求属性值不可再分裂成更小部分,即属性项不能是属性组合和组属性组成。

(8)2NF: 第二范式。如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的某个候选键,则称是第二范式模式;如果某个数据库模式中每个关系模式都是第二范式的,则称该数据库模式属于第二范式的数据库模式。(注:如果A是关系模式R的候选键的一个属性,则称A是R的主属性,否则称A是R的非主属性。)

(9)3NF:第三范式。如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选键,则称R是第三范式的模式。如果某个数据库模式中的每个关系模式都是第三范式,则称为3NF的数据库模式。

(10)BCNF:BC范式。如果关系模式R是第一范式,且每个属性都不传递依赖于R的候选键,那么称R

是BCNF的模式。

(11)4NF:第四范式。设R是一个关系模式,D是R上的多值依赖集合。如果D中成立非平凡多值依赖X→→Y时,X必是R的超键,那么称R是第四范式的模式。

(12)推理规则的正确性和完备性:正确性是指,如果X→Y是从推理规则推出的,那么X→Y在F+中。完备性是指,不能从F使用推理规则导出的函数依赖不在F+中。

(13)依赖集的覆盖和等价:关系模式R(U)上的两个函数依赖集F和G,如果满足F+=G+,则称F和G是等价的。如果F和G等价,则可称F覆盖G或G覆盖F。

(14)最小依赖集:如果函数集合F满足以下三个条件:(1)F中每个函数依赖的右部都是单属性;(2)F中的任一函数依赖X→A,其F-{X→A}与F是不等价的;(3)F中的任一函数依赖X→A,Z为X的子集,(F-{X→A})∪{Z→A}与F 不等价。则称F为最小函数依赖集合,记为Fmin。

(15)无损联接:设R是一关系模式,分解成关系模式ρ={R1,R2...,Rk},F是R上的一个函数依赖集。如果对R中满足F的每一个关系r都有r=πR1(r)πR2(r)...πRk(r)则称这个分解相对于F是“无损联接分解”。

(16)保持依赖集:所谓保持依赖就是指关系模式的函数依赖集在分解后仍在数据库中保持不变,即关系模式R到ρ={R1,R2,...,Rk}的分解,使函数依赖集F被F这些Ri上的投影蕴涵。

(17)多值依赖:设R(U)是属性集U上的一个关系模式,X,Y,Z是U的子集,并且Z=U-X-Y, 用x,y,z分别代表属性集X,Y,Z的值,只要r是R的关系,r中存在元组(x,y1,z1)和(x,y2,z2)时,就也存在元组(x,y1,z2)和(x,y2,z1),那么称多值依赖(MultiValued Dependency MVD)X→→Y在关系模式R中成立。

4.2 关系模式R有n个属性,在模式R上可能成立的函数依赖有多少个? 其中平凡的函数依赖有多少个?非平凡的函数依赖有多少个?

(要考虑所有可能的情况,数学排列组合问题。对于数据库本身而言,本题没多大意义)

所有属性相互依赖时,函数依赖最多。

·

平凡的函数依赖:对于函数依赖X→Y,如果YX,那么称X→Y是一个“平凡的函数依赖”。

4.3 建立关于系、学生、班级、社团等信息的一个关系数据库,一个系有若干个专业,每个专业每年只招一个班,每个班有若干个学生,一个系的学生住在同一宿舍区,每个学生可以参加若干个社团,每个社团有若干学生。

描述学生的属性有:学号、姓名、出生年月、系名、班级号、宿舍区。

描述班级的属性有:班级号、专业名、系名、人数、入校年份。

描述系的属性有:系名、系号、系办公地点、人数。

描述社团的属性有:社团名、成立年份、地点、人数、学生参加某社团的年份。

请给出关系模式,写出每个关系模式的最小函数依赖集,指出是否存在传递函数依赖,对于函数依赖左部是多属性的情况,讨论函数依赖是完全函数依赖还是部分函数依赖。指出各关系的候选键、外部键,有没有全键存在?

各关系模式如下:

学生(学号,姓名,出生年月,系名,班级号,宿舍区)

班级(班级号,专业名,系名,人数,入校年份)

系(系名,系号,系办公地点,人数)

社团(社团名,成立年份,地点,人数)

加入社团(社团名,学号,学生参加社团的年份)

学生(学号,姓名,出生年月,系名,班级号,宿舍区)

●“学生”关系的最小函数依赖集为:

Fmin={学号→姓名,学号→班级号,学号→出生年月,学号→系名,系名→宿舍区} ●以上关系模式中存在传递函数依赖,如:学号→系名,系名→宿舍区

●候选键是学号,外部键是班级号,系名。

notice: 在关系模式中,如果Y→X,X→A,且XY(X不决定Y),A不属于X,那么称Y→A是传递依赖。

班级(班级号,专业名,系名,人数,入校年份)

●“班级”关系的最小函数依赖集为:

Fmin={(系名,专业名)→班级号,班级号→人数,班级号→入校年份,班级号→系名,班级号→专业名}

(假设没有相同的系,不同系中专业名可以相同)●以上关系模式中不存在传递函数依赖。

●“(系名,专业名)→班级号”是完全函数依赖。

●候选键是(系名,专业名),班级号,外部键是系名。

系(系名,系号,系办公地点,人数)

●“系”关系的最小函数依赖集为: Fmin={系号→系名,系名→系办公地点,系名→人数,系名→系号}

●以上关系模式中不存在传递函数依赖

●候选键是系名,系号

社团(社团名,成立年份,地点,人数)

●“社团”关系的最小函数依赖集为: Fmin={社团名→成立年份,社团名→地点,社团名→人数)

●以上关系模式中不存在传递函数依赖。

●候选键是社团名

加入社团(社团名,学号,学生参加社团的年份)

●“加入社团”关系的最小函数依赖集为: Fmin={(社团名,学号)→学生参加社团的年份)●“(社团名,学号)→学生参加社团的年份”是完全函数依赖。

●以上关系模式中不存在传递函数依赖。

●候选键是(社团名,学号)。

4.4 对函数依赖X→Y的定义加以扩充,X和Y可以为空属性集,用φ表示,那么X→φ,φ→Y,φ→φ的含义是什么?

根据函数依赖的定义,以上三个表达式的含义为:

(1)一个关系模式R(U)中,X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2, 由t1[X]=t2[X]必有t1[φ]=t2[φ]。即X→φ表示空属性函数依赖于X。这是任何关系中都存在的。

(2)φ→Y表示Y函数依赖于空属性。由此可

知该关系中所有元组中Y属性的值均相同。

(3)φ→φ表示空属性函数依赖于空属性。这也是任何关系中都存在的。

4.5 已知关系模式R(ABC),F={A→C,B→C},求F+。

可以直接通过自反律、增广律、传递律加以推广:

F+={φ→φ,A→φ,B→φ,C→φ,A→C,B→C,AB→φ,AB→A,AB→B,AB→C,AB→BC,AB→AB,AB→ABC,BC→φ,BC→C,BC→B,BC→BC,AC→φ,AC→C,AC→A,AC→AC,ABC→φ,ABC→A,ABC→B,ABC→C,ABC→BC,ABC→AB,ABC→ABC}

4.6 试分析下列分解是否具有无损联接和保持函数依赖的特点:

(1)设R(ABC),F1={A→B} 在R上成立,ρ1={AB,AC}。

首先,检查是否具有无损联接特点:

第1种解法--算法4.2:

(1)构造表

(2)根据A→B进行处理

结果第二行全是a行,因此分解是无损联接分解。

第2种解法:(定理4.8)设 R1=AB,R2=AC

R1∩R2=A

R2-R1=B

∵A→B,∴该分解是无损联接分解。

然后,检查分解是否保持函数依赖

πR1(F1)={A→B,以及按自反率推出的一些函数依赖}

πR2(F1)={按自反率推出的一些函数依赖}

F1被πR1(F1)所蕴涵,∴所以该分解保持函数依赖。

(2)设R(ABC),F2={A→C,B→C}在R上成立,ρ2={AB,AC}

首先,检查是否具有无损联接特点:

第1种解法(略)

第2种解法:(定理4.8)设 R1=AB,R2=AC

R1∩R2=A

R2-R1=C

∵A→C,∴该分解是无损联接分解。

然后,检查分解是否保持函数依赖

πR1(F2)={按自反率推出的一些函数依赖}

πR2(F2)={A→C,以及按自反率推出的一些函数依赖} ∵F1中的B→C没有被蕴涵,所以该分解没有保持函数依赖。

(3)设R(ABC),F3={A→B},在R上成立,ρ3={AB,BC}.首先,检查是否具有无损联接特点:

第1种解法:

(1)构造表

(2)根据A→B进行处理

没有一行全是a行。因此这个分解不具有无损联接特性。

第2种解法:(定理4.8)

设 R1=AB,R2=BC

R1∩R2=B

R2-R1=C,R1-R2=A

∵B→C,B→A不在F3中 ∴该分解不具有无损联接特性。

然后,检查分解是否保持函数依赖

πR1(F3)={A→B,以及按自反率推出的一些函数依赖}

πR2(F3)={按自反率推出的一些函数依赖}

F1被πR1(F3)所蕴涵,所以该分解保持函数依赖。

(4)设R(ABC),F4={A→B,B→C}在R上成立,ρ4={AC,BC}

首先,检查是否具有无损联接特点:

第1种解法(略)

第2种解法:(定理4.8)

设 R1=AC,R2=BC

R1(AC)∩R2(BC)=C

R2-R1=B,R1-R2=A

∵C→B,C→A不在F4中 ∴该分解不具有无损联接特性。

然后,检查分解是否保持函数依赖

πR1(F2)={按自反率推出的一些函数依赖}

πR2(F2)={B→C,以及按自反率推出的一些函数依赖}

∵F1中的A→B没有被蕴涵,所以该分解没有保持函数依赖。

4.7 设R=ABCD,R上的函数依赖集F={A→B,B→C,A→D,D→C},R的一个分解ρ={AB,AC,AD},求:(1)F在ρ的每个模式上的投影。(2)ρ相对于F是无损联接分解吗?(3)ρ保持依赖吗?(1)

πAB(F)={A→B,及按自反律所推导出的一些平凡函数依赖} πAC(F)={A→C,及按自反律所推导出的一些平凡函数依赖} πAD(F)={A→D,及按自反律所推导出的一些平凡函数依赖}(2)

(1)构造表

(2)根据A→B,B→C,A→D,D→C进行处理

每一行都是a,ρ相对于F是无损联接分解。

(3)πAB(F)∪πAC(F)∪πAD(F)={A→B,A→C,A→D}, 没有满足B→C,D→C函数依赖,因此ρ相对于F的这个分解不保持函数依赖。

4.8 设R=ABCD,R上的F={A→C,D→C,BD→A}, 试证明ρ={AB,ACD,BCD}相对于F不是无损联接分解。

根据算法4.2

(1)构造表

(2)根据A→C,D→C,BD→A进行处理

没有一行都是a,所以,ρ相对于F不是无损联接分解。

4.9 设R=ABCD,R上的F={A→B,B→C,D→B},把R分解成BCNF模式集。

(1)若首先把R分解成{ACD,BD},试求F在这两个模式上的投影。

(2)ACD和BD是BCNF吗?如果不是,请进一步分解。

(1)πACD(F)={A→C}

πBD(F)={D→B}

(2)因为根据BCNF的定义,要求关系模式是第一范式,且每个属性都不传递依赖于R的侯选键。BCD中(A,D)为候选键,可是(A,D)→A, A→C,所以它不是BCNF模式。

它可进一步分解为:{AC,DC},此时AC,DC均为BCNF模式。

BD是BCNF,因为R2(BD)是第一范式,且每个属性都不传递依赖于D(候选键),所以它是BCNF模式。

4.10 设R=ABCD,ρ={AB,BC,CD}。F1={A→B,B→C};F2={B→C,C→D};

(1)如果F1是R上的函数依赖集,此时ρ是无损联接分解吗?若不是,试举出反例。

(2)如果F2是R上的函数依赖集呢?

(1)不是无损联接。可由算法4.2判断或由定理4.8判断。

根据算法4.2

(1)构造表

(2)根据A→B,B→C进行处理

结果没有出现一行全a的情况,所以它不是无损联接。举例如下:

设模式R的一关系r为{(a1b1c1d1),(a2b2c1d2)} 则有:r1=πAB(r)={(a1b1),(a2b2)}

r2=πBC(r)={(b1c1),(b2c1)}

r3=πCD(r)={(c1d1),(c1d2)} 令a=r1r2r3={(a1b1c1d1),(a1b1c1d2),(a2b2c1d1),(a2b2c1d2)} r≠a,所以ρ不是无损联接。

(2)如果F2是R上的函数依赖,则可以判断,ρ是无损联接。判断过程同上。

4.11 设关系模式R(S#,C#,GRADE,TNAME,TADDR),其属性分别表示学生学号、选修课程的编号,成绩、任课教师地址等意义。如果规定,每个学生每学一门课只有一个成绩; 每门课只有一个教师任教;每个教师只有一个地址(此处不允许教师同名同姓)。

(1)试写出关系模式R基本的函数依赖和候选键。

(2)试把R分解成2NF模式集并说明理由。

(3)试把R分解成3NF模式集,并说明理由。

(1)F={(S#,C#)→GRADE,C#→TNAME,TNAME→TADDR} 侯选键是(S#,C#)。

(2)在模式R中,TNAME不完全依赖于键(S#,C#),因此需进行分解,可分解为下列两个关系。

SC={S#,C#,GRADE} C={C#,TNAME,TADDR} 分解后,SC中,GRADE完全依赖于侯选键(S#,C#),在C中,主属性是C#,TNAME、TADDR均完全依赖于C#。因此,该分解符合2NF模式。

(3)3NF:若每个关系模式是2NF,则每个非主属性都不传递于R的候选键。

按上述已分好的两个模式,SC中已满足“每个非主属性都不传递于R的候选键”,已是3NF,而在C中,C#→TNAME,TNAME→TADDR,TADDR传递依赖于C#,因此还需分成两个模式:CT(C#,TNAME), T(TNAME,TADD)。

分解后,总共有SC={S#,C#,GRADE},CT(C#,TNAME), T(TNAME,TADD)三个模式。

该分解符合3NF模式。

4.12 图4.6表示一个公司各部门的层次结构,对每个部门,数据库中包含部门号(唯一的)D#,预算费(BUDGET)以及此部门领导人员的职工号(唯一的)E#等信息。对每一个部门,还存有部门的全部职工,生产科研项目以及办公室的信息。

职工信息包括:职工号,他所参加的生产科研项目号(J#),他所在办公室的电话号(PHONE#)。

生产科研项目包含:项目号(唯一的),预算费。

办公室信息包含:办公室号(唯一的),面积。

对每个职工,数据库中有他曾担任过的职务以及担任某一职务时的工资历史。对每个办公室包含此办公室中全部电话号吗的信息。

请给出你认为合理的数据依赖,把这个层次结构转换成一组规范化的关系。

提示:此题可分步完成,先转换成一组1NF的关系,然后逐步转换成2NF,3NF,...。

先得到一个泛关系的模式如下:

D={D#,Manager_E#,Budget,E#,J#,Phone#,Business,Sa_History,Office#,Area} D#:部门号, Manager_E#:部门领导人员的职工号, E#:职工号, J#:生产科研项目号, Phone#:办公室的电话号,Business:职工职务,Sa_History:工资历史,Office#:办公室号,Area:办公室面积

根据所给信息,给出下列数据依赖:

F={D#→Manager_E#,E#→Office#,(E#,Business)→Sa_History,J#→Budget,E#→J#,Office#→Area,Office→D#,#Phone#→Office#}(假设一个部门可能有多个办公室,有多个项目,一个办公室只属于一个部门,有多部电话,一个员工只参加一个项目,一个项目可能属于多个部门)

只要保证每个属性值不可分割,以上范式即为1NF。候选键为(E#,Business,Phone#)

转换成2NF关系(消除局部依赖):

Em_Dep(E#,D#,Manager_E#,Office#,Area,J#,Budget)

对应 F={D#→Manager_E#,E#→Office#,J#→Budget,E#→J#,Office#→Area,Office→D#}

History(E#,Business,History)

对应 F={(E#,Business)→Sa_History} Phone(Phone#,Office#)

对应 F={Phone#→Office#}

转换成3NF关系(消除非主属性对侯选键的传递依赖):

Department(D#,Manager_E#)Office(Office#,Area,D#)Emproee(E#,J#,Office#)

History(E#,Business,History)Phone(Phone#,Office#)Project(J#,Budget)

注意:由于对题意理解的不同,可能答案不唯一。

4.13 设关系模式R(ABC)上有一个多值依赖A→→B。如果已知R的当前关系中存在三组(ab1c1)、(ab2c2)和(ab3c3),那么这个关系中至少还应存在哪些元组?

从多值依赖的定义可以得出,至少应存在下列元组:

(ab1c2)、(ab1c3)、(ab2c1)、(ab2c3)、(ab3c1)、(ab3c2)

5.1 名词解释

(1)数据库设计:数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。

(2)数据库工程:指数据库应用系统的开发,它是一项软件工程,但有数据库应用自身的特点。(3)评审:在数据库设计过程中,评审的目的是为了确认某一阶段的任务是否全部完成,避免重大的疏漏或错误,并在生存期的早期阶段给予纠正,以减少系统研制的成本。

(4)数据字典:是对系统中数据的详尽描述,它提供对数据库数据描述的集中管理。它的处理功能是存储和检索元数据,并且为数据库管理员提供有关的报告。对数据库设计来说,数据字典是进行详细的数据收集和数据分析所获得的主要成果。数据字典主要包括四个部分:数据项、数据结构、数据流、数据存储。

5.2 数据系统的生存期分成哪几个阶段?数据库结构的设计在生存期中的地位如何?

分成七个阶段 :规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行和维护。

数据库结构的设计在生存期中的地位很重要,数据库结构的设计包括逻辑设计、物理设计,逻辑设计把概念模式转化为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构,而物理设计主要是设计DB在物理设备上的存储结构与存取方法等。

5.3 什么是数据库设计?数据库设计过程的输入和输出有哪些内容?

数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。

数据库设计过程的输入包括四部分内容:1)总体信息需求;2)处理需求;(3)DBMS的特征;(4)硬件和OS(操作系统)特征。

数据库设计过程的输出包括两部分:

(1)完整的数据库结构,其中包括逻辑结构和物理结构;

(2)基于数据库结构和处理需求的应用程序的设计原则。这些输出一般以说明书的形式出现。

5.4 基于数据库系统生存期的数据库设计分成哪几个阶段?

分为5个阶段:简记为(规需概逻物):规划、需求分析、概念设计、逻辑设计和物理设计五个阶段。

5.5 什么是比较好的数据库设计方法?数据库设计方法应包括哪些内容? 一个好的数据库设计方法应该能在合理的期限内,以合理的工作量产生一个有实用价值的数据库结构。

一种实用的数据库设计方法应包括以下内容:设计过程、设计技术、评价准则、信息需求、描述机制。

5.6 数据库设计的规划阶段应做哪些事情?

数据库设计中的规划阶段的主要任务是进行建立数据库的必要性及可行性分析,确定数据库系统在组织中和信息系统中的地位,以及各个数据库之间的联系。

5.7 数据库设计的需求分析阶段是如何实现的?目标是什么?

数据库设计的需求分析通过三步来完成:即需求信息的收集、分析整理和评

数据库期末复习总结

第一篇:数据库期末复习总结 数据库原理综合习题答案 1.1 名词解释 (1)DB:即数据库(Database),是统一管理的相关数...
点击下载
分享:
最新文档
热门文章
    确认删除?
    QQ
    • QQ点击这里给我发消息
    微信客服
    • 微信客服
    回到顶部