• 【热点】柯洁 VS AlphaGo,人类终将在智慧游戏上满盘皆输?

    时间:2017-06-02    来源:《IT经理世界》    作者:正月 我要评论() 字号:T | T

  •  正月发自乌镇 

    “我作为棋手就应该拼搏,要奋战到死。我自己也不完美,所以和人下棋也会输,无论任何场合,碰到任何对手,就只有拼搏。”这是柯洁的信条,也是今天上午,人们对人类排名第一的他和AlphaGo对战的期望。

    AlphaGo去年战胜李世石九段之后,今年年初,阿尔法围棋的“替身”——Master(大师)在网上快棋对战中日韩高手,竟取得了“60连胜”的惊人战绩。这一次人们将希望寄托在赛制上,“60连胜”采用的是快棋战,而此次乌镇对决采用的每方3小时的慢棋对战。据称,这种赛制将有利于人类发现AI的弱点,从而实现逆转。

    实际上,进入五月,柯洁九段先后参加了新奥杯世界赛和中国围甲联赛进行赛前备战。柯洁在这两项大赛中共下了8盘棋,成绩是6胜2负。在这8盘棋中,柯洁九段尝试了几种对付阿尔法围棋的新战法。

    自人机大战第一季以来,AlphaGo已经为围棋这个古老的游戏开启了新纪元。对局中,AlphaGo显示了独特的创造性,使用了一些前所未有的招法。这甚至促使职业棋手和围棋爱好者在对局中尝试人工智能曾使用的招法和战术。千百年来的围棋常识,在新的思考中被更新。

    AlphaGo去年对阵李世石九段的那几局棋,可以说整个颠覆了棋手们对于围棋的认知。AlphaGo所展现出来的实力大大超出我们的预期,并且给围棋带来了很多新的思路。”

    ——时越,职业九段,世界冠军

    “我相信所有棋手都或多或少受到了‘阿老师’的影响。AlphaGo的对局让我们感受到围棋的自由性,没有任何一招棋是绝对不可能的。如今,每一名棋手都在尝试新的风格,这在过去是不可想象的。”

    ——周睿羊,职业九段,世界冠军

     人机大战第二季,柯洁九段表示:“我站在历史变革的节点,很幸运能见证AlphaGo这样强大的对手,我会尽最大努力下好自己的棋,不会轻易妥协,不会说输了无所谓。我抱有必胜心态、必死信念,不会轻易言败。作为棋手,从来只有输和赢。输棋痛苦外人无法想象,只有胜利是唯一真谛,所以我会不惜一切手段去争取胜利,不惜我的一切,真的,去拼了!”

     AlphaGo为何如此凶猛?

     1

    AlphaGo如何进行训练?

    一直以来,围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间,更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。

    为了应对围棋的巨大复杂性,AlphaGo 采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo 产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

     

    2

    AlphaGo 如何决定落子?

    在获取棋局信息后,AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

     

    3

    AlphaGo有怎样的棋风?

    AlphaGo最强大的地方,并不体现在具体某一手棋或者某个局部变化中,而是它在每一局棋里所展现出来的独特视角。虽然AlphaGo的棋风本身并不容易总结,但是总体来说,AlphaGo更倾向于使用一种自由、开放式的行棋风格。

    在它的世界里,没有什么先入为主的概念,也没有什么必须要遵守的规则,这让它得以打破常规,发现当前棋局中最高效的一手。在接下来的两局棋里,AlphaGo这种独特的对局哲学,常常让它下出违反第一感、但却极具威力的一手棋。

    虽然围棋是围地盘的游戏,但事实上最具决定性的部分在于如何平衡棋盘上的各个局部。在这一点上,AlphaGo展现出了卓越的能力。尤其值得一提的是,AlphaGo对于外势的把控可以说到达了出神入化的地步,具体来说,它可以近乎准确地判断棋盘上现有棋子能给周围区域带来多大的影响力。

    虽说棋子的影响力本身很难衡量,但是AlphaGo强大的价值网络让它能够把棋盘上所有的棋子当作一个整体来考虑,因此它的判断几近精确。AlphaGo的这种能力,使得它能够把局部棋子的影响力,转变为全局的优势。

    棋士柯洁:《最后的对决》

    决战前夕,感慨万千...

    在这个特殊的时间,我有些话想和热爱围棋、关注围棋、关注我的朋友们说:

    无论输赢,这都将是我与人工智能最后的三盘对局

    很多人可能会问为什么?

    其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了...我相信未来是属于人工智能的。

    可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言...它的热情——也只不过是运转速度过快导致CPU发热罢了。

    我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这...最后一次...

    拼尽全力后,无论结果...管他口中是是非非,来一首《沧海一声笑》..岂不美哉、快意?我淡然笑到...

    不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战。

  • 加入收藏
  • [ 作者:正月 ]
  • 分享到: 更多
    标签:
  • 相关推荐
    无相关信息
  • 最新消息
    · 央视诉超鱼TV索赔100万 因后者转播里约奥运会闭幕式2017-09-01
    · 张近东内部交流会讲话:苏宁要做互联网零售,收购国米带来巨大提升2017-08-18
    · 苹果酝酿取消打赏抽成:不再强推应用内购买,视为个人赠予2017-07-19
    · 央视点名苏宁投资海外足球 苏宁云商开盘跌4.39%2017-07-19
    · 学霸君首谈高考机器人答题失误原因:机器当时没看懂题目2017-07-12
      已有条评论,查看更多评伦发表评论
  • 用户名:  密码:              匿名发表  | 注册会员
  • 网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述