GraphLab发布新产品 统一大数据平台整合多种类型的数据

日期: 2014-07-27 作者:Ed Burns翻译:陈洪钰 来源:TechTarget中国 英文

近日,美国大数据初创公司GraphLab宣称,公司引进了一种能够帮助扩展企业级机器学习技术的新的分析平台。

公司创始人兼CEO Carlos Guestrin表示,公司希望能够把多种类型的数据存储在一个分析平台上,简化大数据处理流程。

软件供应商Paradigm4本月的调研结果也显示,在100名接受调研的数据科学家中,71%的人都认为大数据的主要挑战来自于数据类型,而非数据规模。

新发布的GraphLab Create可应用于多数主流的数据存储,包括Hadoop集群、亚马逊Redshift数据库、NoSQL数据库和基于桌面的数据库。它提供API(应用程序编程接口),包括一些预置的算法,比如推荐引擎等。用户可以用Python写任务。具体的价格信息公司会在今年年底发布。

类似的产品其实已经在市场上出现,比如Apache Spark就是其中之一,它为多种类型的数据存储提供统一界面。大数据机器学习供应商Skytree也提供类似的产品。不过,Guestrin回应道,比之于开源Spark,Create更成熟也更稳定。和Skytree相比,Create能提供更多个性化的功能。

Guestrin表示,平台使用的Python语言,之所以没有选择R语言或其他编程语言,是因为Python能够实现机器学习技术的纵向扩展,更好地满足企业的需求。

从市场角度来看,用户确实有使用统一大数据平台的需求,而Create恰能满足这种需求。但最终能否占领这一细分市场,还要看Create在与Spark等同类产品的竞争中能否胜出。现在竞争的焦点在于争夺客户。

Create已经经过了Cloudera Hadoop发行版的认证,并且打包到了Pivotal Hadoop发行版中。Spark也打包到了上述两家厂商的Hadoop发行版中,另外还有Hortonworks、IBM和MapR。目前,GraphLab有100多个测试用户,包括美国房产网站Zillow,美国流媒体音乐服务商潘多拉(Pandora)和石油天然气厂商埃克森美孚。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

作者

Ed Burns
Ed Burns

TechTarget网站编辑,重点关注商务智能、数据分析和数据可视化技术。

相关推荐