释放Oracle Exadata架构的潜能

日期: 2013-06-17 作者:Christo Kutrovsky翻译:孙瑞 来源:TechTarget中国 英文

Oracle Exadata是甲骨文公司在2008年OpenWorld大会上发布的一体机产品。在过去的五年时间里,虽然Exadata已经积累了超过1000个部署用户,但在我看来根本没有一个用户真正将Exadata的架构潜力完美释放出来。一直以来,大多数企业在非Exadata环境下对Oracle数据库管理不当的情况屡见不鲜,而这样的情况现在也同样发生在Exadata身上。   尽管许多用户的使用方式不当,但Exadata架构仍然提供了诸多优势,比如大多数部署用户能够通过高端硬件配置得到显著的性能提升。

将数据库数据从企业SAN中解放出来,仅就这一点就能够带来极大的性能改进。Exadata拥有专用的……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

Oracle Exadata是甲骨文公司在2008年OpenWorld大会上发布的一体机产品。在过去的五年时间里,虽然Exadata已经积累了超过1000个部署用户,但在我看来根本没有一个用户真正将Exadata的架构潜力完美释放出来。一直以来,大多数企业在非Exadata环境下对Oracle数据库管理不当的情况屡见不鲜,而这样的情况现在也同样发生在Exadata身上。

  尽管许多用户的使用方式不当,但Exadata架构仍然提供了诸多优势,比如大多数部署用户能够通过高端硬件配置得到显著的性能提升。将数据库数据从企业SAN中解放出来,仅就这一点就能够带来极大的性能改进。Exadata拥有专用的磁盘集,同时在前端还有非常大的SSD cache,这对于解决数据库磁盘I/O瓶颈是非常有帮助的。

  然而,企业往往不会深入理解Exadata的架构,以至于无法完全利用这一强大平台的能力。在针对相同数据的大型批处理操作以及毫秒级响应需求时,Exadata可以说是能够改变游戏规则的产品。但这有一个前提,就是“相同数据”。

  Exadata架构中一个独有的关键技术就是“混合列压缩”,这一技术并不能够简单地理解为列式存储。尽管有相似的地方,但混合列压缩技术不会遇到纯粹列示存储所需要应对的问题。Oracle的混合列压缩针对数据库的每一列都采用了多级压缩和不同的算法,只有这样才能将压缩比最大化。典型的数据压缩比是10:1,而对于高度重复数据,这一比例还可能达到50:1,甚至80:1。

  近期我参与了一个Exadata的部署,其中负责数据建模与ETL设计工作。最大的挑战就是2 TB的非结构化数据集与结构化、定义良好的数据库进行集成。我们需要将面向用户的应用从此前的每日发送报表邮件,转化为一个实时的、亚秒级响应的系统,同时还需要有下钻能力。通过使用星型Schema设计,事实表一共有170亿行,然而只占据了400 GB的存储空间。由于我们使用了Oracle Exadata的混合列压缩,平均的数据压缩比达到了14:1,而如果不用这一功能,那么整个数据库就将达到5.6 TB。而通过将ETL面向混合列压缩来进行设计,我们最终能够将优势最大化,同时每天都能接近实时地处理1亿条记录。

  不只是磁盘存储,还包括了cache空间。将数据库表压缩14倍,就意味着能够将SSD和RAM缓存层的效率提升14倍。然后通过使用Exadata的智能扫描技术,我们能够利用非常高的扫描速度来进行批量报表生成。

  通过不同的索引选择,Exadata能够为相同的数据提供高速的批处理以及毫秒级的精确记录查找,这对于用户而言是非常独特且有价值的特性。

  我见过无数公司挣扎着希望解决类似的问题,而他们的选择往往是一些开源产品,比如Hadoop、HBase、Hive、MongoDB或者CouchDB。开源平台需要类似于SQL的功能,这些才是传统IT部门员工所熟悉的技术。越来越多的企业已经达到这一目标,但都经历了大量时间的研发。

  在几乎所有的情况下,只要正确使用Oracle Exadata架构就可以解决这些问题。那么究竟是什么让企业对其望而却步呢?软件许可费用以及高昂的成本是讨论最多的一个原因,然而我们也不能忽视研发所投入的时间与精力。使用Oracle数据库能够在几个月内完成的项目,在使用其他平台时可能要用上1-2年时间。

  企业不选择Exadata的另外一个原因就是对关系型数据库限制的顾虑。有时甚至一次不愉快的经历就能让企业远离关系型数据库,转而寻找其他选择。然而其他的数据库平台在备份、数据复制、自动总结表和索引等方面还无法与关系型数据库相提并论。

  为了帮助企业认识到他们一直以来所忽视的优势,我将开始在这一专栏里为您解读为何企业应该选择RDBMS。敬请期待!

翻译

孙瑞
孙瑞

相关推荐