数据库设计方法:数据库的设计思路方法、规范标准和窍门技巧

、数据库设计过程
  数据库技术是信息资源管理最有效手段数据库设计是指对于个给定应用环境构造最优数据库模式建立数据库及其应用系统有效存储数据满足用户信息要求和处理要求
  数据库设计中需求分析阶段综合各个用户应用需求(现实世界需求)在概念设计阶段形成独立于机器特点、独立于各个DBMS产品概念模式(信息世界模型)用E-R图来描述在逻辑设计阶段将E-R图转换成具体数据库产品支持数据模型如关系模型形成数据库逻辑模式然后根据用户处理要求安全性考虑在基本表基础上再建立必要视图(VIEW)形成数据外模式在物理设计阶段根据DBMS特点和处理需要进行物理存储安排设计索引形成数据库内模式
  1. 需求分析阶段
  需求收集和分析结果得到数据字典描述数据需求(和数据流图描述处理需求)
  需求分析重点是调查、收集和分析用户在数据管理中信息要求、处理要求、安全性和完整性要求
  需求分析思路方法:调查组织机构情况、调查各部门业务活动情况、协助用户明确对新系统各种要求、确定新系统边界
  常用调查思路方法有: 跟班作业、开调查会、请专人介绍、询问、设计调查表请用户填写、查阅记录
  分析和表达用户需求思路方法主要包括自顶向下和自底向上两类思路方法自顶向下结构化分析思路方法(Structured Analysis简称SA思路方法)从最上层系统组织机构入手采用逐层分解方式分析系统并把每层用数据流图和数据字典描述
  数据流图表达了数据和处理过程关系系统中数据则借助数据字典(Data Dictionary简称DD)来描述
  数据字典是各类数据描述集合它是有关数据库中数据描述即元数据而不是数据本身数据字典通常包括数据项、数据结构、数据流、数据存储和处理过程 5个部分(至少应该包含每个字段数据类型和在每个表内主外键)
  数据项描述={数据项名数据项含义介绍说明别名数据类型长度
         取值范围取值含义和其他数据项逻辑关系}
  数据结构描述={数据结构名含义介绍说明组成:{数据项或数据结构}}
  数据流描述={数据流名介绍说明数据流来源数据流去向
         组成:{数据结构}平均流量高峰期流量}
  数据存储描述={数据存储名介绍说明编号流入数据流流出数据流   
          组成:{数据结构}数据量存取方式}
  处理过程描述={处理过程名介绍说明输入:{数据流}输出:{数据流},
          处理:{简要介绍说明}}
  2. 概念结构设计阶段
  通过对用户需求进行综合、归纳和抽象形成个独立于具体DBMS概念模型可以用E-R图表示
  概念模型用于信息世界建模概念模型不依赖于某个DBMS支持数据模型概念模型可以转换为计算机上某DBMS支持特定数据模型
  概念模型特点:
  (1) 具有较强语义表达能力能够方便、直接地表达应用中各种语义知识
  (2) 应该简单、清晰、易于用户理解是用户和数据库设计人员的间进行交流语言
  概念模型设计种常用思路方法为IDEF1X思路方法它就是把实体-联系思路方法应用到语义数据模型中种语义模型化技术用于建立系统信息模型
  使用IDEF1X思路方法创建E-R模型步骤如下所示:
  2.1 第零步——化工程
  这个阶段任务是从目描述和范围描述开始确定建模目标开发建模计划组织建模队伍收集源材料制定约束和规范标准收集源材料是这阶段重点通过调查和观察结果业务流程原有系统输入输出各种报表收集原始数据形成了基本数据资料表
  2.2 第步——定义实体
  实体集成员都有个共同特征和属性集可以从收集源材料——基本数据资料表中直接或间接标识出大部分实体根据源材料名字表中表示物术语以及具有“代码”结尾术语如客户代码、代理商代码、产品代码等将其名词部分代表实体标识出来从而初步找出潜在实体形成初步实体表
  2.3 第 2步——定义联系
  IDEF1X模型中只允许 2元联系n元联系必须定义为n个 2元联系根据实际业务需求和规则使用实体联系矩阵来标识实体间 2元关系然后根据实际情况确定出连接关系势、关系名和介绍说明确定关系类型是标识关系、非标识关系(强制或可选)还是非确定关系、分类关系如果子实体每个例子都需要通过和父实体关系来标识则为标识关系否则为非标识关系非标识关系中如果每个子实体例子都和而且只和个父实体关联则为强制否则为非强制如果父实体和子实体代表是同现实对象那么它们为分类关系
  2.4 第 3步——定义码
  通过引入交叉实体除去上阶段产生非确定关系然后从非交叉实体和独立实体开始标识侯选码属性以便唯识别每个实体例子再从侯选码中确定主码为了确定主码和关系有效性通过非空规则和非多值规则来保证个实体例子个属性不能是空值也不能在同个时刻有个以上找出误认确定关系将实体进步分解最后构造出IDEF1X模型键基视图(KB图)
  2.5 第 4步——定义属性
  从源数据表中抽取介绍说明性名词开发出属性表确定属性所有者定义非主码属性检查属性非空及非多值规则此外还要检查完全依赖规则和非传递依赖规则保证个非主码属性必须依赖于主码、整个主码、仅仅是主码以此得到了至少符合关系理论第 3范式改进IDEF1X模型全属性视图
  2.6 第 5步——定义其他对象和规则
  定义属性数据类型、长度、精度、非空、缺省值、约束规则等定义触发器、存储过程、视图、角色、同义词、序列等对象信息
  3. 逻辑结构设计阶段
  将概念结构转换为某个DBMS所支持数据模型(例如关系模型)并对其进行优化设计逻辑结构应该选择最适于描述和表达相应概念结构数据模型然后选择最合适DBMS
  将E-R图转换为关系模型实际上就是要将实体、实体属性和实体的间联系转化为关系模式,这种转换般遵循如下原则:
  1)个实体型转换为个关系模式实体属性就是关系属性实体码就是关系
  2)个m:n联系转换为个关系模式和该联系相连各实体码以及联系本身属性均转换为关系属性而关系码为各实体码组合
  3)个1:n联系可以转换为个独立关系模式也可以和n端对应关系模式合并如果转换为个独立关系模式则和该联系相连各实体码以及联系本身属性均转换为关系属性而关系码为n端实体
  4)个1:1联系可以转换为个独立关系模式也可以和任意端对应关系模式合并
  5) 3个或 3个以上实体间个多元联系转换为个关系模式和该多元联系相连各实体码以及联系本身属性均转换为关系属性而关系码为各实体码组合
  6)同实体集实体间联系即自联系也可按上述1:1、1:n和m:n 3种情况分别处理
  7)具有相同码关系模式可合并
  为了进步提高数据库应用系统性能通常以规范标准化理论为指导还应该适当地修改、调整数据模型结构这就是数据模型优化确定数据依赖消除冗余联系确定各关系模式分别属于第几范式确定是否要对它们进行合并或分解般来说将关系分解为3NF标准即:
  表内个值都只能被表达
  表内行都应该被唯标识(有唯键)
  表内不应该存储依赖于其他键非键信息
  4. 数据库物理设计阶段
  为逻辑数据模型选取个最适合应用环境物理结构(包括存储结构和存取思路方法)根据DBMS特点和处理需要进行物理存储安排设计索引形成数据库内模式
  5. 数据库实施阶段
  运用DBMS提供数据语言(例如SQL)及其宿主语言(例如C)根据逻辑设计和物理设计结果建立数据库编制和调试应用组织数据入库并进行试运行 数据库实施主要包括以下工作:用DDL定义数据库结构、组织数据入库 、编制和调试应用、数据库试运行
  6. 数据库运行和维护阶段
  数据库应用系统经过试运行后即可投入正式运行在数据库系统运行过程中必须不断地对其进行评价、调整和修改包括:数据库转储和恢复、数据库安全性、完整性控制、数据库性能监督、分析和改进、数据库重组织和重构造
  建模工具使用
  为加快数据库设计速度目前有很多数据库辅助工具(CASE工具)如Rational公司Rational RoseCA公司Erwin和BpwinSybase公司PowerDesigner以及Oracle公司Oracle Designer等
  ERwin主要用来建立数据库概念模型和物理模型它能用图形化方式描述出实体、联系及实体属性ERwin支持IDEF1X思路方法通过使用ERwin建模工具自动生成、更改和分析IDEF1X模型不仅能得到优秀业务功能和数据需求模型而且可以实现从IDEF1X模型到数据库物理设计转变ERwin工具绘制模型对应于逻辑模型和物理模型两种在逻辑模型中IDEF1X工具箱可以方便地用图形化方式构建和绘制实体联系及实体属性在物理模型中ERwin可以定义对应表、列并可针对各种数据库管理系统自动转换为适当类型
  设计人员可根据需要选用相应数据库设计建模工具例如需求分析完成的后设计人员可以使用Erwin画ER图将ER图转换为关系数据模型生成数据库结构;画数据流图生成应用
   2、数据库设计窍门技巧
  1. 设计数据库的前(需求分析阶段)
  1) 理解客户需求询问用户如何看待未来需求变化让客户解释其需求而且随着开发继续还要经常询问客户保证其需求仍然在开发的中
  2) 了解企业业务可以在以后开发阶段节约大量时间
  3) 重视输入输出
  在定义数据库表和字段需求(输入)时首先应检查现有或者已经设计出报表、查询和视图(输出)以决定为了支持这些输出哪些是必要表和字段
  举例:假如客户需要个报表按照邮政编码排序、分段和求和你要保证其中包括了单独邮政编码字段而不要把邮政编码糅进地址字段里
  4) 创建数据字典和ER 图表
  ER 图表和数据字典可以让任何了解数据库人都明确如何从数据库中获得数据ER图对表明表的间关系很有用而数据字典则介绍说明了每个字段用途以及任何可能存在别名对SQL 表达式文档化来说这是完全必要
  5) 定义标准对象命名规范标准
  数据库各种对象命名必须规范标准
  2. 表和字段设计(数据库逻辑设计)
  表设计原则
  1) 标准化和规范标准化
  数据标准化有助于消除数据库中数据冗余标准化有好几种形式但Third Normal Form(3NF)通常被认为在性能、扩展性和数据完整性方面达到了最好平衡简单来说遵守3NF 标准数据库表设计原则是:“One Fact in _disibledevent=red>Access)、关联设计文档名称、客户等信息这样可以实现种简单机制跟踪数据库当客户抱怨他们数据库没有达到希望要求而和你联系时这样做对非客户机/服务器环境特别有用
  4) 包含版本机制
  在数据库中引入版本控制机制来确定使用中数据库版本时间用户需求总是会改变最终可能会要求修改数据库结构把版本信息直接存放到数据库中更为方便
  5) 编制文档
  对所有快捷方式、命名规范标准、限制和都要编制文档
  采用给表、列、触发器等加注释数据库工具对开发、支持和跟踪修改非常有用
  对数据库文档化或者在数据库自身内部或者单独建立文档这样当过了年多时间后再回过头来做第2 个版本犯错机会将大大减少
  6) 测试、测试、反复测试
  建立或者修订数据库的后必须用用户新输入数据测试数据字段最重要让用户进行测试并且同用户道保证选择数据类型满足商业要求测试需要在把新数据库投入实际服务的前完成
  7) 检查设计
  在开发期间检查数据库设计常用技术是通过其所支持应用原型检查数据库换句话说针对每种最终表达数据原型应用保证你检查了数据模型并且查看如何取出数据
   3、数据库命名规范标准
  1. 实体(表)命名
  1) 表以名词或名词短语命名确定表名是采用复数还是单数形式此外给表别名定义简单规则(比方说如果表名是个单词别名就取单词前4 个字母;如果表名是两个单词就各取两个单词前两个字母组成4 个字母长别名;如果表名字由3 个单词组成从头两个单词中各取个然后从最后个单词中再取出两个字母结果还是组成4 字母长别名其余依次类推)
  对工作用表来说表名可以加上前缀WORK_ 后面附上采用该表应用名字在命名过程当中根据语义拼凑缩写即可注意由于ORCLE会将字段名称统成大写或者小写中所以要求加上下划线
  举例:
  定义缩写 Sales: Sal 销售;
  Order: Ord 订单;
  Detail: Dtl 明细;
  则销售订单明细表命名为:Sal_Ord_Dtl;
  2) 如果表或者是字段名称仅有个单词那么建议不使用缩写而是用完整单词
  举例:
  定义缩写 Material Ma 物品;
  物品表名为:Material, 而不是 Ma.
  但是字段物品编码则是:Ma_ID;而不是Material_ID
  3) 所有存储值列表表前面加上前缀Z
  目是将这些值列表类排序在数据库最后
  4) 所有冗余类命名(主要是累计表)前面加上前缀X
  冗余类是为了提高数据库效率非规范标准化数据库时候加入字段或者表
  5) 关联类通过用下划线连接两个基本类的后再加前缀R方式命名,后面按照字母顺序罗列两个表名或者表名缩写
  关联表用于保存多对多关系
  如果被关联表名大于10个字母必须将原来表名进行缩写如果没有其他原因建议都使用缩写
  举例:表Object和自身存在多对多关系,则保存多对多关系表命名为:R_Object;
  表 Depart和Employee;存在多对多关系;则关联表命名为R_Dept_Emp
  2. 属性(列)命名
  1) 采用有意义列名表内列要针对键采用整套设计规则个表都将有个自动ID作为主健,逻辑上主健作为第组候选主健来定义,如果是数据库自动生成编码命名为:ID;如果是自定义逻辑上编码则用缩写加“ID”思路方法命名如果键是数字类型你可以用_NO 作为后缀;如果是类型则可以采用_CODE 后缀对列名应该采用标准前缀和后缀
  举例:销售订单编号字段命名:Sal_Ord_ID;如果还存在个数据库生成自动编号则命名为:ID
  2) 所有属性加上有关类型后缀注意如果还需要其它后缀都放在类型后缀的前
  注: 数据类型是文本字段类型后缀TX可以不写有些类型比较明显字段可以不写类型后缀
  3) 采用前缀命名
  给每个表列名都采用统前缀那么在编写SQL表达式时候会得到大大简化这样做也确实有缺点比如破坏了自动表连接工具作用后者把公共列名同某些数据库联系起来
  3. 视图命名
  1) 视图以V作为前缀其他命名规则和表命名类似;
  2) 命名应尽量体现各视图功能
  4. 触发器命名
  触发器以TR作为前缀触发器名为相应表名加上后缀Insert触发器加"_I"Delete触发器加"_D"Update触发器加"_U"如:
  TR_Customer_ITR_Customer_DTR_Customer_U
  5. 存储过程名
  存储过程应以"UP_"开头和系统存储过程区分后续部分主要以动宾形式构成并用下划线分割各个组成部分如增加代理商帐户存储过程为"UP_Ins_Agent_Account"
  6. 变量名
  变量名采用小写若属于词组形式用下划线分隔每个单词如@my_err_no
  7. 命名中其他注意事项
  1) 以上命名都不得超过30个系统限制变量名长度限制为29(不包括标识@)
  2) 数据对象、变量命名都采用英文禁止使用中文命名绝对不要在对象名的间留空格
  3) 小心保留词要保证你字段名没有和保留词、数据库系统或者常用访问思路方法冲突
  5) 保持字段名和类型致性在命名字段并为其指定数据类型时候定要保证致性假如数据类型在个表里是整数那在另个表里可就别变成型了
Tags:  数据库设计 数据库课程设计 数据库技巧 数据库设计方法

延伸阅读

最新评论

发表评论