机器学习项目面临哪些障碍?听听IT经理怎么说

日期:2016-12-8作者:Craig Stedman

【TechTarget中国原创】

IT和分析经理认为机器学习应用程序的最大挑战,包括数据准备和开发算法驱动的分析模型。

几十年来,机器学习已经成为高级分析场景的一部分,但是大数据平台和创建自动分析算法工具的出现使得机器学习变得更加重要。因此,越来越多的IT和分析团队面临着来自使机器学习项目的挑战。

在许多组织中,机器学习计划需要在IT基础设施上进行大规模投资,往往涉及到Hadoop集群,Spark处理引擎和其他大数据技术的部署。新的数据管理和分析过程往往还需要准备数据集进行分析,并开发算法实现数据运行。在许多情况下,这意味着要通过外部招聘或培训现有员工增加新的技能。

所谓深度学习应用程序,就是将人工智能与机器学习相结合,使组织能更好地应对更复杂的分析工作。例如,解释图像信息以便更好地按照内容分类。需要强调的是,深度学习加大了数据科学家和统计学家通过自动算法建立预测模型的开发难度。

在2016年Hadoop峰会上,一些与会者分享了他们在机器学习项目中遇到的最大挑战,其中包括前期数据准备工作的复杂性和使用机器学习算法库作为模型开发过程的一部分。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

评论
查看更多评论

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者>更多

Craig Stedman
Craig Stedman

TechTarget执行编辑,主要负责商务智能和数据库网站的内容编辑,在IT技术领域具有丰富的采编经验

数据质量与治理>更多

相关推荐

技术手册>更多

  • 数据集成建模指南

    数据集成流程的开发类似于数据库的开发。在开发数据库过程中,业务需求的蓝图或者模型必须确保对需要的部分有清楚的理解。

  • Oracle商务智能手册

    Oracle BI部署、Oracle OBIEE仪表盘技术、Oracle BI项目实施案例、Oracle Hyperion、Oracle Exalytics。

  • SSIS专题二:详解SSIS性能调试

    本专题中作者依照步骤详细介绍了如何进行SSIS的性能调整,如SSIS简化数据维护、SSIS中的错误信息、如何在SSIS中调试SSIS包等等。 

  • 体育行业BI案例集锦

    本次技术手册,我们为您精心总结了多个体育行业的BI应用案例,让您更加直观地感受BI技术与竞技体育结合所碰撞出的火花。

TechTarget

最新资源
  • 安全
  • CIO
  • SOA
  • 数据库
  • 网络
  • 云计算
【TechTarget中国原创】

IT和分析经理认为机器学习应用程序的最大挑战,包括数据准备和开发算法驱动的分析模型。

几十年来,机器学习已经成为高级分析场景的一部分,但是大数据平台和创建自动分析算法工具的出现使得机器学习变得更加重要。因此,越来越多的IT和分析团队面临着来自机器学习项目的挑战。

在许多组织中,机器学习计划需要在IT基础设施上进行大规模投资,往往涉及到Hadoop集群,Spark处理引擎和其他大数据技术的部署。新的数据管理和分析过程往往还需要准备数据集进行分析,并开发算法实现数据运行。在许多情况下,这意味着要通过外部招聘或培训现有员工增加新的技能。

所谓深度学习应用程序,就是将人工智能与机器学习相结合,使组织能更好地应对更复杂的分析工作。例如,解释图像信息以便更好地按照内容分类。需要强调的是,深度学习加大了数据科学家和统计学家通过自动算法建立预测模型的开发难度。

在2016年Hadoop峰会上,一些与会者分享了他们在机器学习项目中遇到的最大挑战,其中包括前期数据准备工作的复杂性和使用机器学习算法库作为模型开发过程的一部分。

可穿戴相机制造商GoPro的数据科学与工程高级经理Chester Chen表示:“最大的挑战是准备数据。所有这些数据以不同形式进入,在正确的数据管道获取正确的数据是一个相当艰巨的任务。”

移动和IoT分析服务提供商Webtrends公司首席技术官Peter Crossley分享了自己的体会:“获取以某种形式进行清理或管理的数据比较困难。你必须有一个规范化的数据集——可以在数据湖转储所有数据,但是数据沼泽很难进行分析。”

创新制药公司工程总监Murali Kaundinya说道:“数据分析师不想处理所有机器学习库。最大的挑战是为他们提供一个平台,即使他们没有成为机器学习方面的专家也可以使用这个平台。”

美国德克萨斯大学MD安德森癌症中心分析主管Bryan Lari认为:“你从不精确的数据开始分析,所以当它达到了足够高的数据精度,你也会相信你得到了准确的结果。”

雅虎云计算和大数据平台高级主管Sumeet Singh表示:“我们必须让它变得更加简单。在做任何事情之前,数据科学家可以花一个月或两个来评估一个特定的库。这的确是一个障碍。”