如何建立数据仓库:建立数据仓库的八条规则



  本文将阐述建立数据仓库 8条规则,尤其是如何建立第个数据仓库实际上,对于如何建立个成功数据仓库,现实中不存在也根本不可能存在个涵盖万千、放的 4海而皆准"宝书"几乎可以肯定是,在建立第个数据仓库时候,用户肯定会犯,这是不可避免本文规则意义仅仅在于,帮助用户避免些已知缺陷而对于那些不可避免必然,这些规则会尽可能地帮助用户减轻可能带来危害

  规则:从小处着手

  不要上来就要完成个大规模企业范围数据仓库,这样会使用户陷入逻辑、行政和财政泥沼中而不能自拔

  数据仓库不是越大越有效,较小系统价值对机构来讲可能会很大例如,用户可以将第个数据仓库实现定位于个特定部门和应用或者业务线时采用规模向下数据集市可以降低开发成本,缩短实现周期,并有助于为未来数据仓库发展培训IT人员

  规则 2:向大处考虑

  即使在建立第个面向特定部门或特定应用数据集市时,也定要保证现在所使用数据模型能够向将来企业范围数据存储扩展,以便于将来其他数据集市和战略数据仓库实现

  必须在部门的间进行致性数据定义,并使每个人都遵守例如,如何构成个"销售体系"?是预约登记、开发票还是付款?在这些定义上致性协议会使以后部门数据联合成为可行、有效

  规则 3:定义目标和量化收益

  在项目开始实施以前,用户必须明确回答几个问题我们为什么要建立个数据仓库?项目同我们机构任务致吗?哪些问题是我们致力于要去解决?要考虑及时推入市场、质量和客户满意度等原因吗?

  在进行了目标问题认知以后,应该认清哪些是关键性影响成功原因,以便于在解决方案实施进程中进行跟踪例如,收益和运输单位(units shipped)可能是对丧失市场份额产生作用两个影响原因

  在确立了这些关键成功影响原因以后,用户就可以在应用中设置"自动水开标记或警报"这些警报保证对底层产生直接影响最重要数据是清晰可见,便于及时采取行动定义了成功影响原因后,在使用数据仓库时就可以检测到威胁成功原因

  旦这些基本目标确立以后,下个基本要求是对来自数据仓库可预期收益进行量化只有在做了这些工作以后,管理层才会有据可依地判断个数据仓库成功和否

  量化目标不定非是数字或金融表达式,它们只需要明确、有意义即可

  许多机构都采用金融衡量标准,比如ROI,来对收益进行量化IDC对62家数据仓库实现进行研究表明,在数据仓库项目上总体ROI为401%,平均回报时间为2~3年数据集市ROI经检验为533%其他类型收益衡量标准还包括成本节约程度以及可获得能够进行衡量效率

  规则 4:取得最高管理层支持和认可

  数据仓库中涉及到信息共享,这必然会由于部门数据所有者人为原因造成失控在数据所有权和数据存放等问题上内部纷争,很容易给数据仓库带来进程上滞延和失败

  这种数据上"割据"必须在项目开始就立即加以解决理想情况是,公司最高管理层个或者几个成员能够为数据仓库进行部门或部门的间对象设置管理层支持有助于打破各个部门的间日益严重由于数据保护而形成行政壁垒

  在整个过程中,终端用户也是个不可忽视原因如果那些首先进行数据输入人员不了解数据仓库意义,用户很容易地陷入摊"垃圾"数据中用户用来决策数据应该同最初输入数据样好

  规则 5:等待完美不会带来收益

  如果已经进行了目标定义,明确了关键成功影响原因,并且数据仓库项目规模得到了合理控制,那么就不要永久地等待下去,这样下去什么也不会得到尽快行动起来,开始分享数据仓库投资带来回报用户不应拘泥于所谓"完美"不放,旦客户开始访问到新数据仓库中信息,研究结果展现在他们面前,他们很快会发现自己需要更多信息和更详细细节

  研究表明,数据仓库以每年大约40%速率在增长随着用户需求发展,应用能够不断修改和的适应这种方式是个"垒砖"方式,迈向数据仓库步路就是快速实现它

  规则 6:选择能够和用户需求匹配系统

  如上所述,要认识到数据仓库将可能以每年递增40%或更多速度增长同时要认识到,用户和职员不可能非常准确地预料到系统上和未来负载情况这种固有精确度缺乏就需要软件Software和硬件具有可伸缩性,能够容纳更多客户、进程和存储发展

  这种性能必须在设计开始就考虑进去否则,就可能因设置过大而超出系统适用范围,白白将投资浪费掉

  规则 7:要确保数据仓库工具协作使用

  尽管数据仓库市场已经进入了第 2代,它仍然是不成熟其表现为过多过剩产品,有太多厂家而无明确领导者,导致了行业上竞争,使购买决策变得困难这使得那些想对来自多厂家数据仓库工具和应用进行集成厂商感到惶惑不知所措同其他信息技术领域区别,如TCP/IP对于网络,RISC/UNIX对于企业级计算,SMTP对于消息传递,HTML和Java对于Web等,可靠、被广泛接受数据仓库标准还不存在

  在集成多厂家数据仓库工具时,IT人员由于缺少了明确定义标准指导,而使数据仓库实施从开始就处于风险中些大厂家通过将他们产品和其他厂家产品进行捆绑来降低风险,并做些集成

  规则 8:关系价值

  在建立第个数据仓库时,选择正确合作伙伴是很关键,包括顾问、分销商以及软件Software和硬件厂家

  选择合作伙伴是基于其能力, 2是基于其具有长期同舟共济愿望要自问下,这个厂家在实现以后是否还会积极地帮助我解决面临问题?这个厂家现在在我机构中投资是什么?随着我们项目继续推进,情况会是什么样子?

  当困难接踵而至时候,对运作中其他方面不感兴趣合作伙伴将很难和其保持真诚合作

  当寻找能够维持长期合作关系合作伙伴时候(通常是行业内已经建立关系),定要注意自己内在感受例如,在对行业中某个公司位资深顾问进行考察,以探察其对特定应用领域数据集市实现经验时,定要保证能够和的合作想要取得成功,就必须能够和所有厂家和合作伙伴进行有效合作和交流



  上面列出大多数规则集中在人问题上:计划、定义、协调、实战、完美点也不出人意料,数据仓库建立就是为了件事情:帮助人们实实在在地更好地进行决策

  在过去,人为"机器"服务人按照机器所需要格式装载数据,使用机器所定义查询类型来检索信息而今,数据仓库打破了这种传统关系用户成为机器主人,而不是它奴隶但是,自由就意味着责任获得自由人必须要学会全面地考虑问题,设立目标,协商取得致,深思熟虑再做选择,然后果断采取行动

Tags:  什么是数据仓库 数据仓库与数据挖掘 数据仓库 如何建立数据仓库

延伸阅读

最新评论

发表评论