在线阅读杂志

    2017年09月05/20日

    第17/18期 总第467/468期

    封面文章
    互联网消费金融竞“技”
    你有什么超能力?消费啊! 国人跑步向前的消费能力正在给经济结构带来改变。2016年,消费对GDP的贡献首次超过了投资,去年对GDP的贡献占比是66.4%,且呈现继续走高的趋势。 [详细]
    精彩推荐
  • 大数据企业Cloudera:目前市场还在初级阶段,而基础平台已经建立了

    时间:2017-07-26    来源:    作者:李昊原 我要评论() 字号:T | T

  •  谈自动化的历史,从什么时候开始最好?多数人的答案绝不会早于工业革命,而Cloudera的首席技术官、联合创始人Amr Awadallah 会告诉你,从10万年前。

    1765717895.jpg

    10万年前,人类开始有了语言,有了更高效传递知识的工具,与此同时,其他的生命还在用DNA进行经验教训的传承。将低效率的劳动变得高效率,这是一种自动化,人类开始走到了进化的前端。如果从这个角度来看,农业的发展,科学的建立,工业革命和信息技术也是一次次的“自动化”,通过解放人类的劳动来推动社会的进步。在这个视角所及的世界之中,还有一个正在发生并将影响深远的“自动化”进程,Amr Awadallah说,就是决策的自动化。

    世界正在膨胀,以爆炸般的速度疯狂增长,对脑力劳动的需求量足以让过往所有辉煌帝国的统治者感到绝望,原本“肉食者谋之”的事情,甚至已经不能只靠人类了。“比如我们医生的数量不够,不可能让每一个病人都得到有效的医治;我们律师的数量不够,不能够审查每一份需要审查的合同;我们会计的数量可能也不够,没有办法准确有效审查每一份交易;所以怎么办?我们需要培养和训练我们的机器,收集数据之后让机器通过机器学习,让机器来学习人类是如何分析,人类是如何决策的,然后机器就可以以同样甚至更好的速度、准确性和可靠性来完成这些人类的决策,毕竟机器是不用睡觉的。”

    大数据公司Cloudera的长期目标,就是通过利用数据,把今天不可能解决的一些问题,变成明天可以加以解决的问题。“完成这项使命基础性的工作是收集和存储数据,而从长远来看,我们是在这些数据的基础之上,通过机器学习、先进分析和人工智能,帮助解决世界上最富有挑战性的一些难题。” Amr Awadallah介绍了Cloudera和全球知名投资银行摩根大通的合作,摩根大通每年同合作方都会产生了大量需要审查的法律合同,在Cloudera的平台上,通过机器学习来审核有关内容,原本需要一个律师40万个小时(约46.7年)才能完成关的工作,用10分钟就能完成。还有同医疗软件公司Cerner的合作,在医院,手术后的患者有感染败血症的可能,如果未及时发现,会导致术后患者死亡。Cerner使用Cloudera的解决方案,收集手术数据进行分析,能够高准确度预测患者是否出现败血症,能否出院还是要留院进一步处理。目前还处于初级阶段的这个市场会有多大的体量呢?根据IDC的预测,到2020年我们做的市场的总规模会达到2000亿美元。 Amr Awadallah 说。

    从0到1,再到30

    在硅谷,只有十分之一的创业公司发展良好,只有千分之一的创业企业,最后能够做到几十亿美元的量级。Cloudera在Hadoop出现后的第二年(2008年)成立,用了9年时间,从创业到成功上市,市值超过20亿美元。2008年,Cloudera最初的解决方案就是Hadoop的,主要是基于Hadoop的文件系统和MapReduce,这也是Cloudera的起点。而到了现在,Cloudera已经有了近30个项目。我们有Spark,是现在的重头戏;我们还有Impala,是SQL的引擎;我们还有SoLr,是一个开源的搜索平台,以及很多不同的项目,Hadoop只是其中的一个。” Amr Awadallah认为,Hadoop甚至不是当前最主要趋势的代表,目前机器学习的工具更多是基于Spark。好的创业,要有可行的目标、正确的团队和明确的阶段性任务。从Cloudera的角度,将公司绑定在一个开源的技术或者架构上并非上选,而真正被绑定的是两个策略,一是上文提到的长期目标,另一则是将技术与客户的实践相结合。

    Amr AwadallahCloudera在行业内的领先优势归结为三个方面。首先,是先进的技术,包括陆续发布的kuduCloudera Data Science WorkbenchAltus;第二,是九年里在各行各业客户的解决方案和系统构建方面积累的丰富经验,客户使用产品的数据也反馈过来促进了Cloudera维护和服务的能力的提高;第三,庞大的合作伙伴生态系统,有2600家。

    尤其值得一提的是,ClouderaAWS等云计算公司的竞合关系。一方面,Cloudera20%的客户是在云上使用Cloudera产品的,这个比例还在不断攀升,但另一方面,云计算公司同样在云上推出了类似的数据服务。在这种竞争关系下,Cloudera的优势除了更丰富的行业经验外,还在于战略上着眼未来未来的公司,人工智能和机器学习会构成核心的知识产权。如果一家大的银行、大的医院,或者是一个大的制造企业把人工智能和机器学习解决方案百分之百地依赖于像亚马逊、阿里云这样的云服务供应商,把他们最关键的知识产权锁定在专有的算法之中,也许若干年之后,会有被云服务供应商取而代之的风险。 Amr Awadallah说,相较之下,Cloudera的平台完全可迁移,是跨云甚至是跨环境的平台,而且是开源的,机器学习和先进分析的算法,客户是可以看到,可以加以分析,甚至做一些更改来确保差异化的竞争优势,把核心的知识产权掌握在自己手中,中立或第三方的位置,同样成为了Cloudera的一个优势。

    对未来,Amr Awadallah我们会继续专注于打造和演进平台,这是一个跨越行业的横向宽广的平台,能够尽可能多地满足各行各业的需求;与此同时,也要能够为每个客户更好地去服务,我们也非常注重解决方案的垂直行业化。对于在大数据、机器学习、人工智能领域的创业企业,他则建议不要再去创建一个“9年前已经创建出来的平台,而是要把注意力放在在已有平台的基础之上,利用机器学习、人工智能去构建服务于医疗健康、农业、制造业、金融服务业等行业的应用。

  • 加入收藏
  • [ 作者:李昊原 ]
  • 分享到: 更多
    标签:
  • 相关推荐
    无相关信息
  • 最新消息
    · 大数据企业Cloudera:目前市场还在初级阶段,而基础平台已经建立了2017-07-26
    · 360清理大师强势反超猎豹 人工智能成最大助力2017-07-26
    · 汽车大数据与eID双管齐下 中研易通厚积薄发2017-07-12
    · Eniaca推出全新服务管理云平台BizON Cloud比高云2017-07-12
    · 2017软博会全球软件产业发展高峰论坛 演讲大咖影响力解读2017-06-23
      已有条评论,查看更多评伦发表评论
  • 用户名:  密码:              匿名发表  | 注册会员
  • 网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述