专注于互联网--专注于架构

最新标签
网站地图
文章索引
Rss订阅
  调查发现数据质量问题是导致中国企业面临数据集成难题的主要原因之一。  寿命超过了200岁、电话号码中有字母、项目结束时间早于开始时间、生日出现了2月30日等等,在我们看来这些数据根本就不可能,但在计算机系统中这样的数据并不少见。不仅如此,在计算机中还有不少“幽灵数据(缺少最关键的信息,如客户信息缺少姓名等)”以及重复数据(如相同地址的不同表达方式,被当成了两个不同数据)存在。这都是数据质量管理需解决的问题。  导致这些数据质量不高的原因很多,比较常见的是由于计算机操作人员录入时不小心,而应用系统在设计时又缺少对数据的审核和验证,最后进入数据库。在计算机应用早期,数据量小,通过事后的人工核查 [阅读全文] [PDF]
1 共1条 分1页