Rss订阅

首页 »数据库 » 数据库课程设计:数据库设计经验谈 »正文

数据库课程设计:数据库设计经验谈

来源: 发布时间:星期二, 2008年12月23日浏览:121次评论:0

个成功

管理系统

是由:[50%

业务 + 50%

软件Software] 所组成

而 50%

成功软件Software又有 [25%

数据库 + 25%

] 所组成

数据库设计

好坏是

个关键

如果把企业

数据比做生命所必需

血液

那么数据库

设计就是应用中最重要

部分

有关数据库设计

材料汗牛充栋

大学学位课程里也有专门

讲述

不过

就如我们反复强调

那样

再好

老师也比不过经验

教诲

所以我归纳历年来所走

弯路及体会

并在网上找了些对数据库设计颇有造诣

专业人士给大家传授

些设计数据库

窍门技巧和经验

精选了其中

60 个最佳窍门技巧

并把这些窍门技巧编写成了本文

为了方便索引其内容划分为 5 个部分:
第 1 部分 - 设计数据库的前
这

部分罗列了 12 个基本窍门技巧

包括命名规范标准和明确业务需求等

第 2 部分 - 设计数据库表
总共 24 个指南性窍门技巧

涵盖表内字段设计以及应该避免

常见问题等

第 3 部分 - 选择键
如何选择键呢？这里有 10 个窍门技巧专门涉及系统生成

主键

正确使用方法

还有何时以及如何索引字段以获得最佳性能等

第 4 部分 - 保证数据完整性
讨论如何保持数据库

清晰和健壮

如何把有害数据降低到最小程度

第 5 部分 - 各种小窍门技巧
不包括在以上 4 个部分中

其他窍门技巧

5花 8门

有了它们希望你

数据库开发工作会更轻松

些

第 1 部分 - 设计数据库的前
考察现有环境
在设计

个新数据库时

你不但应该仔细研究业务需求而且还要考察现有

系统

大多数数据库项目都不是从头开始建立

；通常

机构内总会存在用来满足特定需求

现有系统(可能没有实现自动计算)

显然

现有系统并不完美

否则你就不必再建立新系统了

但是对旧系统

研究可以让你发现

些可能会忽略

细微问题

般来说

考察现有系统对你绝对有好处

定义标准

对象命名规范标准

定要定义数据库对象

命名规范标准

对数据库表来说

从项目

开始就要确定表名是采用复数还是单数形式

此外还要给表

别名定义简单规则(比方说

如果表名是

个单词

别名就取单词

前 4 个字母；如果表名是两个单词

就各取两个单词

前两个字母组成 4 个字母长

别名；如果表

名字由 3 个单词组成

你不妨从头两个单词中各取

个然后从最后

个单词中再取出两个字母

结果还是组成 4 字母长

别名

其余依次类推)对工作用表来说

表名可以加上前缀 WORK_ 后面附上采用该表

应用

名字

表内

列[字段]要针对键采用

整套设计规则

比如

如果键是数字类型

你可以用 _N 作为后缀；如果是

类型则可以采用 _C 后缀

对列[字段]名应该采用标准

前缀和后缀

再如

假如你

表里有好多“money”字段

你不妨给每个列[字段]增加

个 _M 后缀

还有

日期列[字段]最好以 D_ 作为名字打头

检查表名、报表名和查询名的间

命名规范标准

你可能会很快就被这些区别

数据库要素

名称搞糊涂了

假如你坚持统

地命名这些数据库

区别组成部分

至少你应该在这些对象名字

开头用 Table、Query 或者 Report 等前缀加以区别

如果采用了 Microsoft Access

你可以用 qry、rpt、tbl 和 mod 等符号来标识对象(比如 tbl_Employees)

我在和 SQL Server 打交道

时候还用过 tbl 来索引表

但我用 sp_company (现在用 sp_feft_)标识存储过程

在有

时候如果我发现了更好

处理办法往往会保存好几个拷贝

我在实现 SQL Server 2000 时用 udf_ (或者类似

标记)标识我编写

工欲善其事, 必先利其器
采用理想

数据库设计工具

比如:SyBase 公司

PowerDesign

她支持 PB、VB、Delphe 等语言

通过 ODBC 可以连接市面上流行

30 多个数据库

包括 dBase、FoxPro、VFP、SQL Server 等

今后有机会我将着重介绍 PowerDesign

使用

获取数据模式资源手册
正在寻求举例模式

人可以阅读

数据模式资源手册

书

该书由 Len Silverston、W. H. Inmon 和 Kent Graziano 编写

是

本值得拥有

最佳数据建模图书

该书包括

章节涵盖多种数据领域

比如人员、机构和工作效能等

其他

你还可以参考:[1]萨师煊　王珊著　数据库系统概论(第 2版)高等教育出版社 1991、[2][美] Steven M.Bobrowski 著 Oracle 7 和客户／服务器计算技术从入门到精通　刘建元等译　电子工业出版社

1996、[3]周中元　信息系统建模思路方法(下)　电子和信息化　1999年第3期

1999
畅想未来

但不可忘了过去

教训
我发现询问用户如何看待未来需求变化非常有用

这样做可以达到两个目

:首先

你可以清楚地了解应用设计在哪个地方应该更具灵活性以及如何避免性能瓶颈；其次

你知道发生事先没有确定

需求变更时用户将和你

样感到吃惊

定要记住过去

经验教训！我们开发人员还应该通过分享自己

体会和经验互相帮助

即使用户认为他们再也不需要什么支持了

我们也应该对他们进行这方面

教育

我们都曾经面临过这样

时刻“当初要是这么做了该多好..”

在物理实战的前进行逻辑设计
在深入物理设计的前要先进行逻辑设计

随着大量

CASE 工具不断涌现出来

你

设计也可以达到相当高

逻辑水准

你通常可以从整体上更好地了解数据库设计所需要

方方面面

了解你

业务
在你百分百地确定系统从客户角度满足其需求的前不要在你

ER(实体关系)模式中加入哪怕

个数据表(如何

你还没有模式？那请你参看窍门技巧 9)

了解你

企业业务可以在以后

开发阶段节约大量

时间

旦你明确了业务需求

你就可以自己做出许多决策了

旦你认为你已经明确了业务内容

你最好同客户进行

次系统

交流

采用客户

术语并且向他们解释你所想到

和你所听到

同时还应该用可能、将会和必须等词汇表达出系统

关系基数

这样你就可以让你

客户纠正你自己

理解然后做好下

步

ER 设计

创建数据字典和 ER 图表

定要花点时间创建 ER 图表和数据字典

其中至少应该包含每个字段

数据类型和在每个表内

主外键

创建 ER 图表和数据字典确实有点费时但对其他开发人员要了解整个设计却是完全必要

越早创建越能有助于避免今后面临

可能混乱

从而可以让任何了解数据库

人都明确如何从数据库中获得数据

有

份诸如 ER 图表等最新文档其重要性如何强调都不过分

这对表明表的间关系很有用

而数据字典则介绍说明了每个字段

用途以及任何可能存在

别名

对 SQL 表达式

文档化来说这是完全必要

创建模式

张图表胜过千言万语:开发人员不仅要阅读和实现它

而且还要用它来帮助自己和用户对话

模式有助于提高协作效能

这样在先期

数据库设计中几乎不可能出现大

问题

模式不必弄

很复杂；甚至可以简单到手写在

张纸上就可以了

只是要保证其上

逻辑关系今后能产生效益

从输入输出下手
在定义数据库表和字段需求(输入)时

首先应检查现有

或者已经设计出

报表、查询和视图(输出)以决定为了支持这些输出哪些是必要

表和字段

举个简单

例子:假如客户需要

个报表按照邮政编码排序、分段和求和

你要保证其中包括了单独

邮政编码字段而不要把邮政编码糅进地址字段里

报表窍门技巧
要了解用户通常是如何报告数据

:批处理还是在线提交报表？时间间隔是每天、每周、每月、每个季度还是每年？如果需要

话还可以考虑创建整理总结表

系统生成

主键在报表中很难管理

用户在具有系统生成主键

表内用副键进行检索往往会返回许多重复数据

这样

检索性能比较低而且容易引起混乱

理解客户需求
看起来这应该是显而易见

事

但需求就是来自客户(这里要从内部和外部客户

角度考虑)

不要依赖用户写下来

需求

真正

需求在客户

脑袋里

你要让客户解释其需求

而且随着开发

继续

还要经常询问客户保证其需求仍然在开发

目

的中

个不变

真理是:“只有我看见了我才知道我想要

是什么”必然会导致大量

返工

数据库没有达到客户从来没有写下来

需求标准

而更糟

是你对他们需求

解释只属于你自己

而且可能是完全

第 2 部分 - 设计表和字段
检查各种变化
我在设计数据库

时候会考虑到哪些数据字段将来可能会发生变更

比方说

姓氏就是如此(注意是西方人

姓氏

比如女性结婚后从夫姓等)

所以

在建立系统存储客户信息时

我倾向于在单独

个数据表里存储姓氏字段

而且还附加起始日和终止日等字段

这样就可以跟踪这

数据条目

变化

采用有意义

字段名
有

回我参加开发过

个项目

其中有从其他

员那里继承

那个

员喜欢用屏幕上显示数据指示用语命名字段

这也不赖

但不幸

是

她还喜欢用

些奇怪

命名法

其命名采用了匈牙利命名和控制序号

组合形式

比如 cbo1、txt2、txt2_b 等等

除非你在使用只面向你

缩写字段名

系统

否则请尽可能地把字段描述

清楚些

当然

也别做过头了

比如 Customer_Shipping_Address_Street_Line_1

虽然很富有介绍说明性

但没人愿意键入这么长

名字

具体尺度就在你

把握中

采用前缀命名
如果多个表里有好多同

类型

字段(比如 FirstName)

你不妨用特定表

前缀(比如 CusLastName)来帮助你标识字段

时效性数据应包括“最近更新日期/时间”字段

时间标记对查找数据问题

原因、按日期重新处理/重载数据和清除旧数据特别有用

标准化和数据驱动
数据

标准化不仅方便了自己而且也方便了其他人

比方说

假如你

用户界面要访问外部数据源(文件、XML 文档、其他数据库等)

你不妨把相应

连接和路径信息存储在用户界面支持表里

还有

如果用户界面执行工作流的类

任务(发送邮件、打印信笺、修改记录状态等)

那么产生工作流

数据也可以存放在数据库里

预先安排总需要付出努力

但如果这些过程采用数据驱动而非硬编码

方式

那么策略变更和维护都会方便得多

事实上

如果过程是数据驱动

你就可以把相当大

责任推给用户

由用户来维护自己

工作流过程

标准化不能过头
对那些不熟悉标准化

词(normalization)

人而言

标准化可以保证表内

字段都是最基础

要素

而这

措施有助于消除数据库中

数据冗余

标准化有好几种形式

但 Third Normal Form(3NF)通常被认为在性能、扩展性和数据完整性方面达到了最好平衡

简单来说

3NF 规定:
* 表内

每

个值都只能被表达

次

* 表内

每

行都应该被唯

标识(有唯

键)

* 表内不应该存储依赖于其他键

非键信息

遵守 3NF 标准

数据库具有以下特点:有

组表专门存放通过键连接起来

关联数据

比方说

某个存放客户及其有关定单

3NF 数据库就可能有两个表:Customer 和 Order

Order 表不包含定单关联客户

任何信息

但表内会存放

个键值

该键指向 Customer 表里包含该客户信息

那

行

更高层次

标准化也有

但更标准是否就

定更好呢？答案是不

定

事实上

对某些项目来说

甚至就连 3NF 都可能给数据库引入太高

复杂性

为了效率

缘故

对表不进行标准化有时也是必要

这样

例子很多

曾经有个开发餐饮分析软件Software

活就是用非标准化表把查询时间从平均 40 秒降低到了两秒左右

虽然我不得不这么做

但我绝不把数据表

非标准化当作当然

设计理念

而具体

操作不过是

种派生

所以如果表出了问题重新产生非标准化

表是完全可能

Microsoft Visual FoxPro 报表窍门技巧
如果你正在使用 Microsoft Visual FoxPro

你可以用对用户友好

字段名来代替编号

名称:比如用 Customer Name 代替 txtCNaM

这样

当你用向导

[Wizards

台湾人称为‘精灵'] 创建表单和报表时

其名字会让那些不是

员

人更容易阅读

不活跃或者不采用

指示符
增加

个字段表示所在记录是否在业务中不再活跃挺有用

不管是客户、员工还是其他什么人

这样做都能有助于再运行查询

时候过滤活跃或者不活跃状态

同时还消除了新用户在采用数据时所面临

些问题

比如

某些记录可能不再为他们所用

再删除

时候可以起到

定

防范作用

使用角色实体定义属于某类别

列[字段]
在需要对属于特定类别或者具有特定角色

事物做定义时

可以用角色实体来创建特定

时间关联关系

从而可以实现自我文档化

这里

含义不是让 PERSON 实体带有 Title 字段

而是说

为什么不用 PERSON 实体和 PERSON_TYPE 实体来描述人员呢？比方说

当 John Smith, Engineer 提升为 John Smith, Director 乃至最后爬到 John Smith, CIO

高位

而所有你要做

不过是改变两个表 PERSON 和 PERSON_TYPE 的间关系

键值

同时增加

个日期/时间字段来知道变化是何时发生

这样

你

PERSON_TYPE 表就包含了所有 PERSON

可能类型

比如 Associate、Engineer、Director、CIO 或者 CEO 等

还有个替代办法就是改变 PERSON 记录来反映新头衔

变化

不过这样

来在时间上无法跟踪个人所处位置

具体时间

采用常用实体命名机构数据
组织数据

最简单办法就是采用常用名字

比如:PERSON、ORGANIZATION、ADDRESS 和 PHONE 等等

当你把这些常用

般名字组合起来或者创建特定

相应副实体时

你就得到了自己用

特殊版本

开始

时候采用

般术语

主要原因在于所有

具体用户都能对抽象事物具体化

有了这些抽象表示

你就可以在第 2 级标识中采用自己

特殊名称

比如

PERSON 可能是 Employee、Spouse、Patient、Client、Customer、Vendor 或者 Teacher 等

同样

ORGANIZATION 也可能是 MyCompany、MyDepartment、Competitor、Hospital、Warehouse、Government 等

最后 ADDRESS 可以具体为 Site、Location、Home、Work、Client、Vendor、Corporate 和 FieldOffice 等

采用

般抽象术语来标识“事物”

类别可以让你在关联数据以满足业务要求方面获得巨大

灵活性

同时这样做还可以显著降低数据存储所需

冗余量

用户来自世界各地
在设计用到网络或者具有其他国际特性

数据库时

定要记住大多数国家都有区别

字段格式

比如邮政编码等

有些国家

比如新西兰就没有邮政编码

说

数据重复需要采用分立

数据表
如果你发现自己在重复输入数据

请创建新表和新

关系

每个表中都应该添加

3 个有用

字段
* dRecordCreationDate

在 VB 下默认是 Now

而在 SQL Server 下默认为 GETDATE

* sRecordCreator

在 SQL Server 下默认为 NOT NULL DEFAULT USER
* nRecordVersion

记录

版本标记；有助于准确介绍说明记录中出现 null 数据或者丢失数据

原因
对地址和电话采用多个字段
描述街道地址就短短

行记录是不够

Address_Line1、Address_Line2 和 Address_Line3 可以提供更大

灵活性

还有

电话号码和邮件地址最好拥有自己

数据表

其间具有自身

类型和标记类别

过分标准化可要小心

这样做可能会导致性能上出现问题

虽然地址和电话表分离通常可以达到最佳状态

但是如果需要经常访问这类信息

或许在其父表中存放“首选”信息(比如 Customer 等)更为妥当些

非标准化和加速访问的间

妥协是有

定意义

使用多个名称字段
我觉得很吃惊

许多人在数据库里就给 name 留

个字段

我觉得只有刚入门

开发人员才会这么做

但实际上网上这种做法非常普遍

我建议应该把姓氏和名字当作两个字段来处理

然后在查询

时候再把他们组合起来

我最常用

是在同

表中创建

个计算列[字段]

通过它可以自动地连接标准化后

字段

这样数据变动

时候它也跟着变

不过

这样做在采用建模软件Software时得很机灵才行

总的

采用连接字段

方式可以有效

隔离用户应用和开发人员界面

提防大小写混用

对象名和特殊

过去最令我恼火

事情的

就是数据库里有大小写混用

对象名

比如 CustomerData

这

问题从 Access 到 Oracle 数据库都存在

我不喜欢采用这种大小写混用

对象命名思路方法

结果还不得不手工修改名字

想想看

这种数据库/应用

能混到采用更强大数据库

那

天吗？采用全部大写而且包含下划符

名字具有更好

可读性(CUSTOMER_DATA)

绝对不要在对象名

的间留空格

小心保留词
要保证你

字段名没有和保留词、数据库系统或者常用访问思路方法冲突

比如

最近我编写

个 ODBC 连接

里有个表

其中就用了 DESC 作为介绍说明字段名

后果可想而知！DESC 是 DESCENDING 缩写后

保留词

表里

个 SELECT * 语句倒是能用

但我得到

却是

大堆毫无用处

信息

保持字段名和类型

致性
在命名字段并为其指定数据类型

时候

定要保证

致性

假如字段在某个表中叫做“agreement_number”

你就别在另

个表里把名字改成“ref1”

假如数据类型在

个表里是整数

那在另

个表里可就别变成

型了

记住

你干完自己

活了

其他人还要用你

数据库呢

仔细选择数字类型
在 SQL 中使用 small

和 tiny

类型要特别小心

比如

假如你想看看月销售总额

你

总额字段类型是 small

那么

如果总额超过了 $32,767 你就不能进行计算操作了

删除标记
在表中包含

个“删除标记”字段

这样就可以把行标记为删除

在关系数据库里不要单独删除某

行；最好采用清除数据

而且要仔细维护索引整体性

避免使用触发器
触发器

功能通常可以用其他方式实现

在调试

时触发器可能成为干扰

假如你确实需要采用触发器

你最好集中对它文档化

包含版本机制
建议你在数据库中引入版本控制机制来确定使用中

数据库

版本

无论如何你都要实现这

要求

时间

长

用户

需求总是会改变

最终可能会要求修改数据库结构

虽然你可以通过检查新字段或者索引来确定数据库结构

版本

但我发现把版本信息直接存放到数据库中不更为方便吗？

给文本字段留足余量
ID 类型

文本字段

比如客户 ID 或定单号等等都应该设置得比

般想象更大

时间不长你多半就会

要添加额外

而难堪不已

比方说

假设你

客户 ID 为 10 位数长

那你应该把数据库表字段

长度设为 12 或者 13 个

长

这算浪费空间吗？是有

点

但也没你想象

那么多:

个字段加长 3 个

在有 1 百万条记录

再加上

点索引

情况下才不过让整个数据库多占据 3MB

空间

但这额外占据

空间却无需将来重构整个数据库就可以实现数据库规模

增长了

身份证

号码从 15 位变成 18 位就是最好和最惨痛

例子

列[字段]命名窍门技巧
我们发现

假如你给每个表

列[字段]名都采用统

前缀

那么在编写 SQL 表达式

时候会得到大大

简化

这样做也确实有缺点

比如破坏了自动表连接工具

作用

后者把公共列[字段]名同某些数据库联系起来

不过就连这些工具有时不也连接

嘛

举个简单

例子

假设有两个表:
Customer 和 Order

Customer 表

前缀是 cu_

所以该表内

子段名如下:cu_name_id、cu_surname、cu_initials 和cu_address 等

Order 表

前缀是 or_

所以子段名是:
or_order_id、or_cust_name_id、or_quantity 和 or_description 等

这样从数据库中选出全部数据

SQL 语句可以写成如下所示:
Select * From Customer, Order Where cu_surname = "MYNAME" ;
and cu_name_id = or_cust_name_id and or_quantity = 1
在没有这些前缀

情况下则写成这个样子(用别名来区分):
Select * From Customer, Order Where Customer.surname = "MYNAME" ;
and Customer.name_id = Order.cust_name_id and Order.quantity = 1
第 1 个 SQL 语句没少键入多少

但如果查询涉及到 5 个表乃至更多

列[字段]你就知道这个窍门技巧多有用了

第 3 部分 - 选择键和索引
数据采掘要预先计划
我所在

某

客户部门

度要处理 8 万多份联系方式

同时填写每个客户

必要数据(这绝对不是小活)

我从中还要确定出

组客户作为市场目标

当我从最开始设计表和字段

时候

我试图不在主索引里增加太多

字段以便加快数据库

运行速度

然后我意识到特定

组查询和信息采掘既不准确速度也不快

结果只好在主索引中重建而且合并了数据字段

我发现有

个指示计划相当关键——当我想创建系统类型查找时为什么要采用号码作为主索引字段呢？我可以用传真号码进行检索

但是它几乎就象系统类型

样对我来说并不重要

采用后者作为主字段

数据库更新后重新索引和检索就快多了

可操作数据仓库(ODS)和数据仓库(DW)这两种环境下

数据索引是有差别

在 DW 环境下

你要考虑销售部门是如何组织销售活动

他们并不是数据库管理员

但是他们确定表内

键信息

这里设计人员或者数据库工作人员应该分析数据库结构从而确定出性能和正确输出的间

最佳条件

使用系统生成

主键
这类同窍门技巧 1

但我觉得有必要在这里重复提醒大家

假如你总是在设计数据库

时候采用系统生成

键作为主键

那么你实际控制了数据库

索引完整性

这样

数据库和非人工机制就有效地控制了对存储数据中每

行

访问

采用系统生成键作为主键还有

个优点:当你拥有

致

键结构时

找到逻辑缺陷很容易

分解字段用于索引
为了分离命名字段和包含字段以支持用户定义

报表

请考虑分解其他字段(甚至主键)为其组成要素以便用户可以对其进行索引

索引将加快 SQL 和报表生成器脚本

执行速度

比方说

我通常在必须使用 SQL LIKE 表达式

情况下创建报表

number 字段无法分解为 year、serial number、

type 和 defendant code 等要素

性能也会变坏

假如年度和类型字段可以分解为索引字段那么这些报表运行起来就会快多了

键设计 4 原则
* 为关联字段创建外键

* 所有

键都必须唯

* 避免使用复合键

* 外键总是关联唯

键字段

别忘了索引
索引是从数据库中获取数据

最高效方式的

95%

数据库性能问题都可以采用索引技术得到解决

作为

条规则

我通常对逻辑主键使用唯

成组索引

对系统键(作为存储过程)采用唯

非成组索引

对任何外键列[字段]采用非成组索引

不过

索引就象是盐

太多了菜就咸了

你得考虑数据库

空间有多大

表如何进行访问

还有这些访问是否主要用作读写

大多数数据库都索引自动创建

主键字段

但是可别忘了索引外键

它们也是经常使用

键

比如运行查询显示主表和所有关联表

某条记录就用得上

还有

不要索引 memo/note 字段

不要索引大型字段(有很多

)

这样作会让索引占用太多

存储空间

不要索引常用

小型表
不要为小型数据表设置任何键

假如它们经常有插入和删除操作就更别这样作了

对这些插入和删除操作

索引维护可能比扫描表空间消耗更多

时间

不要把社会保障号码(SSN)或身份证号码(ID)选作键
永远都不要使用 SSN 或 ID 作为数据库

键

除了隐私原因以外

须知政府越来越趋向于不准许把 SSN 或 ID 用作除收入相关以外

其他目

SSN 或 ID 需要手工输入

永远不要使用手工输入

键作为主键

旦你输入

你唯

能做

就是删除整个记录然后从头开始

我在破解他人

时候

我看到很多人把 SSN 或 ID 还曾被用做系列号

当然尽管这么做是非法

而且人们也都知道这是非法

但他们已经习惯了

后来

随着盗取身份犯罪案件

增加

我现在

同行正痛苦地从

大摊子数据中把 SSN 或 ID 删除

不要用用户

键
在确定采用什么字段作为表

键

时候

可

定要小心用户将要编辑

字段

通常

情况下不要选择用户可编辑

字段作为键

这样做会迫使你采取以下两个措施:
* 在创建记录的后对用户编辑字段

行为施加限制

假如你这么做了

你可能会发现你

应用

在商务需求突然发生变化

而用户需要编辑那些不可编辑

字段时缺乏足够

灵活性

当用户在输入数据的后直到保存记录才发现系统出了问题他们该如何想？删除重建？假如记录不可重建是否让用户走开？
* 提出

些检测和纠正键冲突

思路方法

通常

费点精力也就搞定了

但是从性能上来看这样做

代价就比较大了

还有

键

纠正可能会迫使你突破你

数据和商业/用户界面层的间

隔离

所以还是重提

句老话:你

设计要适应用户而不是让用户来适应你

设计

不让主键具有可更新性

原因是在关系模式下

主键实现了区别表的间

关联

比如

Customer 表有

个主键 CustomerID

而客户

定单则存放在另

个表里

Order 表

主键可能是 OrderNo 或者 OrderNo、CustomerID 和日期

组合

不管你选择哪种键设置

你都需要在 Order 表中存放 CustomerID 来保证你可以给下定单

用户找到其定单记录

假如你在 Customer 表里修改了 CustomerID

那么你必须找出 Order 表中

所有相关记录对其进行修改

否则

有些定单就会不属于任何客户——数据库

完整性就算完蛋了

如果索引完整性规则施加到表

级

那么在不编写大量代码和附加删除记录

情况下几乎不可能改变某

条记录

键和数据库内所有关联

记录

而这

过程往往

丛生所以应该尽量避免

可选键(候选键)有时可做主键
记住

查询数据

不是机器而是人

假如你有可选键

你可能进

步把它用做主键

那样

话

你就拥有了建立强大索引

能力

这样可以阻止使用数据库

人不得不连接数据库从而恰当

过滤数据

在严格控制域表

数据库上

这种负载是比较醒目

如果可选键真正有用

那就是达到了主键

水准

我

看法是

假如你有可选键

比如国家表内

state_code

你不要在现有不能变动

唯

键上创建后续

键

你要做

无非是创建毫无价值

数据

如你

过度使用表

后续键[别名]建立这种表

关联

操作负载真得需要考虑

下了

别忘了外键
大多数数据库索引自动创建

主键字段

但别忘了索引外键字段

它们在你想查询主表中

记录及其关联记录时每次都会用到

还有

不要索引 memo/notes 字段而且不要索引大型文本字段(许多

)

这样做会让你

索引占据大量

数据库空间

第 4 部分 - 保证数据

完整性
用约束而非商务规则强制数据完整性
如果你按照商务规则来处理需求

那么你应当检查商务层次/用户界面:如果商务规则以后发生变化

那么只需要进行更新即可

假如需求源于维护数据完整性

需要

那么在数据库层面上需要施加限制条件

如果你在数据层确实采用了约束

你要保证有办法把更新不能通过约束检查

原因采用用户理解

语言通知用户界面

除非你

字段命名很冗长

否则字段名本身还不够

只要有可能

请采用数据库系统实现数据

完整性

这不但包括通过标准化实现

完整性而且还包括数据

功能性

在写数据

时候还可以增加触发器来保证数据

正确性

不要依赖于商务层保证数据完整性；它不能保证表的间(外键)

完整性所以不能强加于其他完整性规则的上

分布式数据系统
对分布式系统而言

在你决定是否在各个站点复制所有数据还是把数据保存在

个地方的前应该估计

下未来 5 年或者 10 年

数据量

当你把数据传送到其他站点

时候

最好在数据库字段中设置

些标记

在目

站点收到你

数据的后更新你

标记

为了进行这种数据传输

请写下你自己

批处理或者调度

以特定时间间隔运行而不要让用户在每天

工作后传输数据

本地拷贝你

维护数据

比如计算常数和利息率等

设置版本号保证数据在每个站点都完全

致

强制指示完整性(参照完整性?)
没有好办法能在有害数据进入数据库的后消除它

所以你应该在它进入数据库的前将其剔除

激活数据库系统

指示完整性特性

这样可以保持数据

清洁而能迫使开发人员投入更多

时间处理

条件

关系
如果两个实体的间存在多对

关系

而且还有可能转化为多对多关系

那么你最好

开始就设置成多对多关系

从现有

多对

关系转变为多对多关系比

开始就是多对多关系要难得多

采用视图
为了在你

数据库和你

应用

代码的间提供另

层抽象

你可以为你

应用

建立专门

视图而不必非要应用

直接访问数据表

这样做还等于在处理数据库变更时给你提供了更多

自由

给数据保有和恢复制定计划
考虑数据保有策略并包含在设计过程中

预先设计你

数据恢复过程

采用可以发布给用户/开发人员

数据字典实现方便

数据识别同时保证对数据源文档化

编写在线更新来“更新查询”供以后万

数据丢失可以重新处理更新

用存储过程让系统做重活
解决了许多麻烦来产生

个具有高度完整性

数据库解决方案的后

我决定封装

些关联表

功能组

提供

整套常规

存储过程来访问各组以便加快速度和简化客户

代码

开发

数据库不只是

个存放数据

地方

它也是简化编码的地

使用查找
控制数据完整性

最佳方式就是限制用户

选择

只要有可能都应该提供给用户

个清晰

价值列表供其选择

这样将减少键入代码

和误解同时提供数据

致性

某些公共数据特别适合查找:国家代码、状态代码等

第 5 部分 - 各种小窍门技巧
文档、文档、文档
对所有

快捷方式、命名规范标准、限制和

都要编制文档

采用给表、列[字段]、触发器等加注释

数据库工具

是

这有点费事

但从长远来看

这样做对开发、支持和跟踪修改非常有用

取决于你使用

数据库系统

可能有

些软件Software会给你

些供你很快上手

文档

你可能希望先开始在说

然后获得越来越多

细节

或者你可能希望周期性

预排

在输入新数据同时随着你

进展对每

部分细节化

不管你选择哪种方式

总要对你

数据库文档化

或者在数据库自身

内部或者单独建立文档

这样

当你过了

年多时间后再回过头来做第 2 个版本

你犯错

机会将大大减少

使用常用英语(或者其他任何语言)而不要使用编码
为什么我们经常采用编码(比如 9935A 可能是‘青岛啤酒'

供应代码

4XF788-Q 可能是帐目编码)？理由很多

但是用户通常都用英语进行研究而不是编码

工作 5 年

会计或许知道 4XF788-Q 是什么东西

但新来

可就不

定了

在创建下拉菜单、列表、报表时最好按照英语名排序

假如你需要编码

那你可以在编码旁附上用户知道

英语

保存常用信息
让

个表专门存放

般数据库信息非常有用

我常在这个表里存放数据库当前版本、最近检查/修复(对 FoxPro)、关联设计文档

名称、客户等信息

这样可以实现

种简单机制跟踪数据库

当客户抱怨他们

数据库没有达到希望

要求而和你联系时

这样做对非客户机/服务器环境特别有用

测试、测试、反复测试
建立或者修订数据库的后

必须用用户新输入

数据测试数据字段

最重要

是

让用户进行测试并且同用户

道保证你选择

数据类型满足商业要求

测试需要在把新数据库投入实际服务的前完成

检查设计
在开发期间检查数据库设计

常用技术是通过其所支持

应用

原型检查数据库

换句话说

针对每

种最终表达数据

原型应用

保证你检查了数据模型并且查看如何取出数据

Microsoft Visual FoxPro 设计窍门技巧
对复杂

Microsoft Visual FoxPro 数据库应用

而言

可以把所有

主表放在

个数据库容器文件里

然后增加其他数据库表文件和装载同原有数据库有关

特殊文件

根据需要用这些文件连接到主文件中

主表

比如数据输入、数据索引、统计分析、向管理层或者政府部门提供报表以及各类只读查询等

这

措施简化了用户和组权限

分配

而且有利于应用

(存储过程)

分组和划分

从而在

必须修改

时候易于管理

标签：数据库设计实例数据库设计数据库课程设计

下载文章的 PDF文档电子版离线看

我顶

专注于互联网--专注于架构

首页 »数据库 » 数据库课程设计:数据库设计经验谈 »正文

数据库课程设计:数据库设计经验谈

相关文章

读者评论

发表评论

热门标签

精华推荐

最新标签

Dig排行

阅读排行

最新文章