如何选择合适的数据仓库架构

日期: 2012-04-25 作者:Sansu George翻译:包春霞 来源:TechTarget中国 英文

在为业务设计数据仓库时,当前最常讨论的两种方法是Bill Inmon和 Ralph Kimball方法。关于哪种方法更好、哪种更高效的争论已经持续了好几年,但是一直没有一个明确的结论。   首先,让我们来快速浏览一下两种方法。   Inmon自上而下的方法   Inmon将数据仓库定义为整个企业级的集中存储库。

数据仓库存放着最低的详细级别的原子数据。维度数据集市只是在数据仓库完成以后才创建的。因此,数据仓库是企业信息工厂(CIF)的中心,它为交付商务智能提供逻辑框架。 点击图片放大   Inmon用以下术语定义数据仓库:   1.面向主题:数据仓库中的数据被组织成所有数据元素都与真实世界的事件……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

在为业务设计数据仓库时,当前最常讨论的两种方法是Bill Inmon和 Ralph Kimball方法。关于哪种方法更好、哪种更高效的争论已经持续了好几年,但是一直没有一个明确的结论。

  首先,让我们来快速浏览一下两种方法。

  Inmon自上而下的方法

  Inmon将数据仓库定义为整个企业级的集中存储库。数据仓库存放着最低的详细级别的原子数据。维度数据集市只是在数据仓库完成以后才创建的。因此,数据仓库是企业信息工厂(CIF)的中心,它为交付商务智能提供逻辑框架。

Inmon将数据仓库定义为整个企业级的集中存储库

点击图片放大

  Inmon用以下术语定义数据仓库:

  1.面向主题:数据仓库中的数据被组织成所有数据元素都与真实世界的事件或对象相关联。

  2.随时间而变化:数据库中数据的改变是可以被跟踪和记录的,可以通过报表显示出数据随时

  3.非易失性:数据仓库中的数据不会被修改或删除。一旦进入数据仓库,数据就是静态的,只读的,只用来为以后提供报表。

  4.集成的:数据库包含来自组织的大部分或所有的业务应用系统数据,而且这些数据是一致产生的。

  Kimball自下而上的方法

  记住,最重要的业务单元或部门的数据集市要先建立。这些数据集市可以为透视组织数据提供一个较窄的视图,需要的时候,这些数据集市还可以与更大的数据仓库合并在一起。Kimball 将数据仓库定义为“一份针对查询和分析做特别结构化的事务数据拷贝。”

  Kimball 的数据仓库结构也就是著名的数据仓库总线(BUS)。维度模型关注的重点是:如何使最终用户访问数据仓库更容易,并有较高的性能。

Kimball 的数据仓库结构

点击放大

  Inmon和Kimball有什么异同?

Inmon和Kimball有什么异同

  两种方法的优点和缺点

Inmon和Kimball对比

点击放大

  如何决策?

  正如我们刚才已经看到的,选择哪种数据仓库设计方法取决于组织的业务目标、业务特性、时间、成本、不同组织单元之间的相互依赖级别。Inmon 的方法比较适合稳定的业务,这些业务能花得起时间做设计也能承担相关的成本。随着每次业务条件的改变,设计不用改变;可以将这些变化包括在现有的模型中。然而,如果本地优先级足够高,而且重点是要快速看到效果,那就建议采用Kimball的方法。记住,让一些部门/组织单元来讨论是选用Inmon方法还是Kimball方法。

  • 保险:了解单个客户、群组的每一次计划和代理的历史、成功失败的趋势、人口统计学、赢利性 的整体状况很重要。如果所有的方面都是相关的,那就比较适合采用Inmon的方法。
  • 市场:这是一个特别的分支,不能叫做企业数据仓库。只需要数据集市就够了。因此,Kimball的方法比较适合。
  • 银行的CRM:关注点是产品销量和客户级别的交叉销售。不必要获得业务的整体视图。例如,不需要将客户的详细信息与处理外汇交易和规则的财务部门相关联。因为范围限制,只能采用Kimball的方法。然而,如果银行中的整个流程和部门相互关联,显然选择Incon的设计要比Kimball方法要好。
  • 制造业:这里涉及到多个组织单元,不必考虑预算。这种情况没有系统依赖,因而需要企业模型,这时还是Inmon的方法比较理想。

  在设计数据仓库时,首先要先看看业务目标——短期目标和长期目标。看看功能之间哪里有联系,什么是独立的。分析数据源的数量和质量。最后,评估你的资源级别、时间和经费。这能帮助你判断用Inmon方法还是用Kimball方法,或者是两种方法的组合。

相关推荐