【大数据小故事】啤酒和尿片故事后面的数据挖掘真相

日期:2016-5-5作者:Shirley Xie

【TechTarget中国原创】

大数据刚刚兴起时,常常听厂商或大数据倡导者说这个啤酒和尿片的故事,鲜活、形象地说明大数据分析给商业带来的无限商机。如果你没有听过的话,我们再讲一遍:

“尿布和啤酒,听起来风马牛不相及,但这是对历史数据进行挖掘的结果,反映的是数据层面的规律。

这种关系令人费解,这是一个真正的规律吗?

经过跟踪调查,研究人员终于发现事出有因:一些年轻的爸爸经常要到超市去购买婴儿尿布,有30%到40%的新爸爸会顺便买点啤酒犒劳自己。沃尔玛随后对啤酒和尿布进行了捆绑销售,不出意料,销售量双双增加。”

——摘自涂子沛的《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》

第一次听到这个故事时,其实心中有惑 。以笔者对美国社会的有限理解,美国很多州的法律是不允许超市买酒类商品,仅在最近几年才开始陆续有些州通过法律,允许超市申请酒的销售执照。但当时被大数据的热潮所吸引,也就无暇深究。最近参加了一些和大数据相关的活动,这个故事又不绝于耳。终于决定探探这个故事的源头。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

评论
查看更多评论

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者>更多

Shirley Xie
Shirley Xie

TechTarget中国原创支持者

数据挖掘>更多

相关推荐

技术手册>更多

  • 新兴大数据分析工具实用手册

    TechTarget中国商务智能网站将众多新兴大数据分析工具打包奉送,包括Amazon Elastic MapReduce、Splunk、Yarn、SharePoint、Teradata QueryGrid和Facebook图谱搜索。

  • SQL Server Integration Services(SSIS)基础指南

    无论你是否计划将SQL Server数据库转换服务(DTS)包迁移到SQL Server集成服务(SSIS)或在SQL Server 2005里运行DTS包,都需要专家的一些建议。这一指南主要是包括SSIS的相关基础知识、技巧帮助你进行SSIS调整,还介绍了SSIS有经验的一些用户的具体信息等等。

  • Hadoop中文指南

    在大数据背景下,Apache Hadoop已经逐渐成为一种标签性,业界对于这一开源分布式技术的了解也在不断加深。

  • SQL Server 2008 R2中文教程

    微软最新的数据库管理平台SQL Server 2008 R2正式发布已经有半年多的时间了,虽然真正部署的用户并不多,但是有许多企业已经在筹划将SQL Server迁移到R2平台了。

TechTarget

最新资源
  • 安全
  • CIO
  • SOA
  • 数据库
  • 网络
  • 云计算
【TechTarget中国原创】

大数据刚刚兴起时,常常听厂商或大数据倡导者说这个啤酒和尿片的故事,鲜活、形象地说明大数据分析给商业带来的无限商机。如果你没有听过的话,我们再讲一遍:

“尿布和啤酒,听起来风马牛不相及,但这是对历史数据进行挖掘的结果,反映的是数据层面的规律。这种关系令人费解,这是一个真正的规律吗?经过跟踪调查,研究人员终于发现事出有因:一些年轻的爸爸经常要到超市去购买婴儿尿布,有30%到40%的新爸爸会顺便买点啤酒犒劳自己。沃尔玛随后对啤酒和尿布进行了捆绑销售,不出意料,销售量双双增加。”

——摘自涂子沛的《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》

第一次听到这个故事时,其实心中有惑 。以笔者对美国社会的有限理解,美国很多州的法律是不允许超市卖酒类商品,仅在最近几年才开始陆续有些州通过法律,允许超市申请酒的销售执照。但当时被大数据的热潮所吸引,也就无暇深究。最近参加了一些和大数据相关的活动,这个故事又不绝于耳。终于决定探探这个故事的源头。

原来这个故事在欧美国家也被传唱,出现的版本还不尽相同。但对此质疑的声音也不少,其中有一位叫Daniel J. Power的教授特此撰文,应该是最全面地有理有据揭开这个故事后面的真相。有兴趣的同学可以详细阅读英文全文:What is the "true story" about using data mining to identify a relation between sales of beer and diapers? (http://www.dssresources.com/newsletters/66.php)。主旨内容如下:

这就是啤酒和尿片的故事真相,所以,这其实并不是数据挖掘的好故事。大家对此故事津津乐道,无外乎希望表达:数据挖掘技术是商业决策的好帮手!