欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  互联网

EMC牵手Kaggle 打造大数据众包人才市场

程序员文章站 2022-06-27 22:14:40
  在纽约O’Reilly Strata Conference + Hadoop World期间,EMC公布了EMC Greenplum Chorus 开源代码,力求与数据科...

  在纽约O’Reilly Strata Conference + Hadoop World期间,EMC公布了EMC Greenplum Chorus 开源代码,力求与数据科学平台商Kaggle合作让企业进一步挖掘大数据的经济价值。

  据McKinsey Global Institute 2011年5月的一份报道《大数据:创新,竞争和产能的下一个前锋》透露,人才的缺乏导致企业需要利用大数据。这种人才的缺乏被广泛认为是大数据流行的最大障碍。EMC和Kaggle宣称已经通过整合GreenplumChorus开始着手解决这种数据专家的短缺,而数据专家们的社交平台Kaggle囊括了55000多名数据科学家。这一消息有望改变有数据问题的企业寻找和联系数据专家们的方式。

  在传统的分析进程中,数据科学家面临面临着访问和共享正确数据的挑战。Greenplum Chorus有助于利用最好的分析应用来培养完整的数据科学生态系统。作为一个协作型的数据科学社交平台,Greenplum Chorus用户可以通过单一工具就可以增加产能,减少IT机构的管理负担,获得更好的可视性以及更快速地访问数据。

  而Kaggle社区的成员可以选择通过Chorus来接活。在Chorus界面里,希望参与到Kaggle社区的Chorus用户会搜索,浏览,点击有兴趣合作的Kaggle 社区成员的资料。通过安全整合Chorus和Kaggle API,用户可以从Chorus Workspaces透露相关信息,并发送安全信息。Kaggle将Chorus作为信息源,并将信息转发给合适的接收者。一旦Kaggle 社区成员查看过信息后,就可以直接进行回复和细节讨论,直至开始项目。

  Kaggle和Chorus的整合为该行业带来了新的机会,方便用户围绕大数据实现协作效益,而且便于数据专家们拓展业务。

  各公司的数据策略必须具备敏捷性。ECM 的Greenplum OpenChorus项目的目的通过开放Chorus代码,促进大数据应用和方案的普遍开发。

  除了Kaggle以外,大量EMC Greenplum合作伙伴都表示为OpenChorus项目提供支持,而且会将自己的工具与方案与Chorus整合。这些合作伙伴包括:Actuate,ADVIZOR Solutions,Alpine Data Labs,Gnip,Informatica,Pentaho,Pervasive,SAS,Syncsor以及Tableau Software。

  总裁引言

  Scott Yara ,EMC Greenplum部门负责产品的高级副总

  “个人,企业和社区的合作对于大数据分析的成功非常有必要。OpenChorus项目是EMC Greenplum大数据技术,策略和工具的一部分——大数据能帮助客户深入了解业务和数据经济价值,所以要把握时机开拓。”“成功取决于协作平台和大数据时代的问题:数据科学家的供需。现在,有了Kaggle及其有着55000多数据科学家的社区,我们相信我们正在永久性地改变数据科学的分析方式。”

  Kaggle CEO Anthony Goldbloom说:“与EMC Greenplum的合作为现有的和未来的Kaggle 社区成员开创了令人惊喜的新机遇。这种合作关系有助于解决数据专家的短缺,公司才能发挥数据的所有价值。”

  可用性

  Greenplum Chorus源代码现在已经可以通过OpenChorus项目获取。Chorus和Kaggle的合作项目有望在2012年11月落地。现在,你就可以下载Chorus,找到你要的数据,将数据可视化,为项目提供资源,分析模式,共享内部情况以及协作,还可以为社区做出自己的贡献。