专注于互联网--专注于架构

最新标签
网站地图
文章索引
Rss订阅

首页 »数据库 » 数据仓库:高效实现数据仓库的 7个步骤 »正文

数据仓库:高效实现数据仓库的 7个步骤

来源: 发布时间:星期二, 2009年2月24日 浏览:0次 评论:0
="t18">
  数据仓库和我们常见RDBMS系统有些亲缘关系但它又有所区别假如你没有实施过数据仓库那么从设定目标到给出设计从创建数据结构到编写数据分析再到面对挑剔用户评估整个过程都会带给你种和以往项目完全区别体验 句话假如你试图以旧有方式创建数据仓库那你所面对不是预算超支就是所建立数据仓库无法良好运作
  
  在处理个数据仓库项目时需要注重问题很多(见实现数据仓库 7种伤害)但同时也有很多有建设性参考可以帮助你更顺利完成任务开放思维不断尝试新途径对于找到种可行数据仓库实现思路方法来说也是必需
  
  1. 配备个全职项目经理(project manager)或你自己全面负责项目治理
  在通常情况下项目经理(project manager)都会同时负责多个项目实施这么做完全是出于资金和IT资源方面考虑但是对于数据仓库项目治理绝对不能出现人身兼数个项目情况由于你所处领域是你和你团队(Team)的前没有进入过领域有关数据仓库切-数据分析、设计、编程、测试、修改、维护-全都是崭新因此你或者你指派项目经理(project manager)假如能全心投入对于项目成功会有很大帮助
  
  2. 将项目治理职责推给别项目经理(project manager)
  由于数据仓库实现过程实在是太困难了为了避免自虐你可以在当前阶段项目完成后就将项目治理职责推给别项目经理(project manager)当然这个新项目经理(project manager)定要复合第条所说具有全职性为什么要这么做呢?首先从项目经理(project manager)角度看数据仓库实施过程任何个阶段都足以让人身心疲惫从物理存储设备开发到Extract-Transform-Load实现从设计开发模型到OLAP所有阶段都明显比以前接触项目更加困难每个阶段不但需要新处理思路方法、新治理思路方法还需要创新性观点所以将治理职责推给别项目经理(project manager)不但不会对项目有损害还可以起到帮助作用
  
  3.和用户进行沟通
  这里所讲内容远比篇文章本身要重要你必须明白在数据仓库设计阶段那些潜在用户自己也不清楚他们到底需要数据仓库为他们做什么他们在不断探索和发现自己需求而你开发团队(Team)也在和客户接触中做着同样事情更加频繁和客户接触多做记录并让你团队(Team)更关注于项目需求讨论结果而不是讨论过程本身
  
  既然你和客户交流是为了了解存储数据是何种类型以及如何有效存储数据你也许需要(和你用户起)采用种新思路方法观察数据而不是直接处理数据你可以尝试从中找出隐藏信息比如在段时期内数字涨落等不要试图追寻项目需求答案而是要让答案找上门来
  
  4. 以技术/信息库作为领导
  由于数据仓库实施各个阶段都有很大区别因此你需要有人能起到维持整个项目连续进行作用不过这个职责并不需要那种全职性项目实施有 3个重要方面:架构、技术和业务将架构作为重点可以保证在整个项目中数据仓库架构从物理层往上都会受到良好维护而我们应该将技术作为重点开发团队(Team)和要害用户都在使用他们以前从未用过工具必须有人监督开发过程以及工具使用致性
  
  最后在数据仓库应用过程中浮现出来业务需求必须被具体分析和记录以促机开发过程持续下去假如用户不能很好开发人员以及其它用户沟通那么数据分析和度量方面开发进程就会延期所以必须有人关注业务方面开发推动开发进入更高级别
  
  5. 跳出反复修改陷阱
  第次实现数据仓库肯定不会是最终交付版本为什么呢?实际上在真正见到产品前你无法确定知道自己目标是什么或者说最终用户只有在使用数据仓库产品段时间后才能明确告诉你这个产品是不是他所希望和你以往处理项目区别业务智能还处于发展初期每个公司对业务智能都有区别解释因此你项目决不会次成功
  
  为了以正确格式获得数据你需要在不断变化状况中摸索前进BI具有很强个性区别环境、区别市场以及区别企业都有区别BI这又代表什么呢?这表示你需要把数据库治理员放在个消息相对封闭环境中不要让他知道数据仓库数据结构以及ETL在不断改变对此没有别办法这样可以减轻你和DBA所承受压力
  
  6. 对大量前端资源进行数据源分析
  在数据仓库实现过程中你不得不在旧有数据中艰难跋涉这些数据来自老数据库、老磁带机以及远程数据它们中大部分都凌乱不堪并且难以获取你要对这些数据进行大量处理并且还要设计ETL来寻找其中有用信息假如你希望整个项目做起来比较顺利并且找到种思路方法能够次成功那就需要你开发人员必须花费足够时间来充分研究这些旧有数据将凌乱数据规则化并尽力设计和实现强壮数据采集和转换过程数据仓库ETL部分会占用整个项目资源百分的 8十所以定要确定你资源都用在刀刃上了
  
  7. 将人际关系处理放在首位
  在数据仓库实现过程中真正地狱不是来自技术或者开发方面而是来自你 4周你也许会碰到个对项目并不乐观而又没时间听你陈述领导你也许会碰到些开发人员将进度拖延太长时间还抱怨为什么不能用老思路方法实施你也许还会碰到些抱有不切实际幻想用户他们希望轻点鼠标就能实现想象中功能但却不愿在他们那边多做些智力投资更好培训他们自己员工而你也已经疲惫不堪鼓励投资以及在开发团队(Team)和用户(甚至老板)中推广新开发窍门技巧
0

相关文章

读者评论

发表评论

  • 昵称:
  • 内容: