• 算法即人

    时间:2013-10-09 来源:IT经理世界 作者: 胡泳 郝亚洲/文 浏览: 我要评论() 字号:T | T

  •  在威斯汀酒店见到郝杰瑞(Jeremy Howard)的时候,他正盘着双腿坐在沙发上。他一见到我们,就用很流利的中文打招呼,然后还说:“咱们共享一壶茶吧,这样能省钱。”落座之后,我问郝杰瑞,“这次到北京来做什么?”他指了指大堂中央摆放的一个易拉宝说,“EMC发起了一个大数据尖端人才研讨会,我虽然不是数据科学家,但是我拥有数据科学家。”

    郝杰瑞是澳大利亚人,甚至在联合创办Kaggle的时候,他人还在澳大利亚家中的卧室里。郝杰瑞对我说,他在大学里学的是哲学,但是从小就会编程。有一次,他想做一个语言学习类的程序,为了挑战自己,他选择了汉语学习作为程序目标。于是,他只身来到北京学习了几个月的汉语。

    在为麦肯锡工作8年之后,郝杰瑞开办了自己的公司。但是一个新闻改变了他的想法。Netflix曾经为了解决推荐算法的问题,在网络上发起了带有奖金的比赛,希望可以引出更多的数据科学家。郝杰瑞说,这对他来说是一个刺激,因为他知道大数据的一个核心问题就是算法,掌握算法的人是最宝贵的资产。于是,他把公司卖掉,与Anthony Goldbloom合伙创办了目前这个世界上最富盛名的数据科学家社区Kaggle。

    我问他,这种人才众包的模式并不新鲜,你们凭什么这么有信心呢?郝杰瑞的回答很有意思。他说,数据科学家是一个对综合素质要求很高的行当,非天才不可及。但是,谁又能指望天才为自己全职工作呢?

    Kaggle的盈利模式很简单,收佣金。Kaggle首先会受机构委托在社区中发起一个比赛项目,奖金由委托机构提供。目前,Kaggle几乎囊括了世界上最顶级的数据科学家群体。为了验证这个说法,他给我举了NASA的委托案例。郝杰瑞一边跟我说,一边用笔在纸上比划着,一会儿画一个大气层,一会儿画一个天文望远镜,一会儿又画了几个银河系,听得我们云里雾里的。最后总算明白了,Kaggle帮助NASA解决了在天文望远镜端的暗物质计算问题。顿时,我们一行人等就有了高端大气上档次的感觉。

    众所周知,腾讯为了解决个性化广告的算法问题,也找到了Kaggle。郝杰瑞说,当时参与竞选的数据科学家有1500人,最终只有一个人入选。迄今为止,Kaggle获利最大的委托项目是为美国著名的保险公司Allstate做一个智能的保单计划。保险公司可以根据用户的行为习惯自动生成保单。比如驾驶技术、开车习惯这些参数,会直接影响到用户的保单金额。这个算法比较复杂,因为每个人和每个人之间都有所不同。

    到底数据科学家会在大数据时代中扮演怎样的角色呢?这是我们此次会面想要了解的核心问题。郝杰瑞二话不说,又拿起笔在纸上比划着。

    由于Kaggle汇集了全球顶尖的数据科学家,大家在一起难免会切磋一番。最后,这些科学家们竟然切磋出了一个惊人的发现:样本数量与精确度之间的正比关系仅仅适用在一定范围里。当到达一个临界点之后,无论样本的数量再怎么庞大,也不会引起精确度的显著变化。

    在临界点之前的数据处理工作只需要数据科学家带着笔记本电脑就能解决。在临界点之后的数据处理工作虽然需要借助大型处理器,但是其适用范围也只会在基因工程、视频、体感这几个有限领域里。

    . . . . . .

  • 加入收藏
  • [ 作者: 胡泳 郝亚洲/文 ]
  • 分享到: 更多
    标签:
  • 相关推荐
    · 大数据未来会变成啥样?像人类大脑一样工作2013-10-09
    · 六年亲历,见证中国大数据技术与应用时代的到来2013-10-08
    · 云时代大数据的出现是好局还是搅局?2013-09-29
    · 寻找“2013中国大数据行业创新案例/人物”活动启动2013-09-27
    · 大数据的反作用力2013-09-26
    · 迎接商业智能3.0时代——大数据时代的商业智能高峰论2013-09-26
    · 亨通集团沈宇逸:数据标准化为大数据做准备2013-09-23
    · 大数据教父传道汽车业大数据变革2013-09-22
    · 朝阳大悦城:不拘一格应用大数据2013-09-18
    · 电信运营商该如何利用大数据2013-09-17
  • 最新消息
    · 算法即人2013-10-09
    · 规模经济的终结2013-10-09
    · 打击糟糕领导者2013-10-09
    · 索尼的移动互联使命2013-10-09
    · C时代的新人群2013-10-09
      已有条评论,查看更多评伦发表评论
  • 用户名:  密码:              匿名发表  | 注册会员
  • 网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述