SAP数据管理系统选择题:HANA还是BW?

日期: 2012-12-18 作者:Ethan Jewett翻译:茶一峰 来源:TechTarget中国 英文

很多SAP环境的企业都在考虑一个问题:到底是应该部署SAP Business Warehouse(BW)还是SAP HANA?或者两个都部署?

  关于这个问题,首先明确的一点是HANA不能取代BW;那么哪一种技术在不同应用场景中的性能更优?BW和HANA的融合程度又如何呢?

  我们知道,HANA是SAP新推出的内存数据平台,SAP NetWeaver BW是一个为提取、建模和排列数据集提供工具的企业数据仓库平台。

  想要知道答案,最好的方法就是分析目前BW和HANA分别能为我们做什么,了解它们的区别和互补性,然后再去考虑哪一个比较有用。这一分析方法旨在研究短期内的技术,以帮助我们为当前的项目进行选择。

  应对数据挑战

  企业在实施BI、数据仓库和其他与数据相关的项目时或多或少都会遇到困难。我们将这些挑战分为六个类别:

  1. 性能

  2. 数据质量

  3. 集成

  4. 数据定义

  5. 安全

  6. 架构和管理

HANA是SAP新推出的内存数据平台,SAP NetWeaver BW是一个为提取、建模和排列数据集提供工具的企业数据仓库平台。

  每一个类别在从单份报表到整个数据仓库的使用案例中的重要程度都有所不同。分类没有绝对的标准,它们多多少少出自我个人经验的判断。因此,每个企业都应该有自己不同的看法。

  既然如此,是什么定义了这六个类别呢?我们又能从中获得关于HANA和BW的什么见解呢?

  • 性能

  在实施使用案例的过程中,只有保障充分的性能,才能迅速处理海量数据的查询。

  在传统的数据平台中,BW通过特定的OLAP数据库模式来提升性能。但在HANA上运行时,BW几乎把所有的性能工作都推给了HANA数据库,当然除了历史归档数据。

  而HANA作为SAP新的性能提升利器,令人刮目相看。虽然不见得“通吃”,但是大部分程序的速度都能通过HANA得到显著提升。

  • 数据质量

  在数据管理过程中,让数据一致、完整、零错误非常困难。对于独立的数据集,通过测试可以解决这个问题,但稳定的数据质量仍然难以达到,一般整合了的数据集的质量都比较低。

  BW能够提供多种数据质量确认能力,包括唯一性确认和参照完整性确认;而HANA本身不具备任何数据质量处理能力,这与大部分多用途数据库和应用平台是一样的。不过,BW和HANA都能够与SAP BusinessObjects Information Steward进行集成。

  • 集成

  提到集成,我们通常都会想到SAP BusinessObjects Data Services或Informatica的ETL工具,工作包括整合孤岛数据源、集成非结构化数据和结构化数据,以及将数据上载到报表系统的基本任务。

  另外,将数据孤岛中的语义概念进行集成也属于这一范畴。例如,“revenue”(具有税收、收益等多重含义)这个单词对你和在别人看来是同一个意思吗?这就得看它的识别规则了,数据也同理。

  HANA和BW在这一块势均力敌,两者都支持BusinessObjects Data Services的ETL工具。BW还具备自带的提取器概念,同时提供业务内容数据源的补充。BW和HANA都为孤岛数据的整合提供了多个选项。

  • 数据定义

  为使用系统数据的用户生成数据定义十分重要。没有定义,数据毫无用处。对于数据专家来说,没有注解的数据集就足够了,正如有些人看一眼数据清单就能了解财务状况或者得出逻辑函数一样;但是,大多数业务人员无法做到这一点。定义的生成工作需要对不同的栏目贴上标签、创建可识别的等级、清晰表现数据的时间点视角和进行视觉探究等。

  除了标准SQL和Multidimensional Expressions(MDX)权限,HANA没有提供更多的功能,不过它的统计功能对那些专家来说足够用了。BW提供了等级、按时间排列的数据,还有多语言支持和强大的查询构建性能。尽管有所不同,但BW和HANA都能通过Information Design Tool在数据集中对BusinessObjects语义进行支持。

  • 安全

  一般情况下,你不会希望任何信息都是透明的。在面向数据的系统中,不同数据会有不同的权限,这样不同授权的概念往往在分析系统中表现得比交易系统更为明显。

  BW和HANA都提供了相应的分析授权概念。BW的概念更为成熟一些,所以我更倾向于它,但两者的差距也不太大。当BW在HANA上运行的时候不会使用HANA的授权系统。

  • 架构和管理

  企业到底需要投入多少精力在管理解决方案上?有秩序的架构管理起来更加容易,这是肯定的,因为解决方案的模型和实施方式都是一样的。另外,在技术改变的同时,架构也需要随之改变。从星型模式到单一柱状表格的转换到底有多困难呢?如果模板一样的话就没那么难。

  不管你需不需要,BW都非常注重架构的秩序和抽象;HANA更像一个普通数据库,不怎么强调秩序。有时秩序很难实现,但却十分必要,尤其针对那些涉及多个数据集市或数据仓库的环境。

HANA更像一个普通数据库

  个人建议:如果你的需求仅仅在于性能、集成和安全方面,HANA完全可以满足,而且总体开销会比BW少;如果你还对架构、数据定义或数据质量方面有所需求,那么还是考虑一下BW吧。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

相关推荐