围棋人机大战终章 柯洁投子认输 AlphaGo从此退役(图)

 作者:王孙陴     |      日期:2018-03-01 09:03:09
在为期5天的“中国乌镇·围棋峰会”中,中国棋手世界排名第一的柯洁与AlphaGo人工智能展开人机大战,三番棋首局较量在23日打响,第一局柯洁以四分之一子惜败AlphaGo,25日举行的第二局比赛则因柯洁盘中认输提前1个多小时结束,大比分2:0在今日进行的最后一局中,柯洁盘中再度认输,终结了这场轰轰烈烈的人机大战 在第三局中,AlphaGo执黑子,柯洁执白子早早陷入困局的柯洁虽以放手一搏挽回些许,但仍不敌AlphaGo,最终柯洁选择投子认输柯洁在赛后表示AlphaGo很完美: “能参加这次比赛是我最大的荣幸对我而言,这次比赛的意义超出人类之前所有比赛今天的棋我以为能下的好一点,没想到在布局阶段就走岀了一步我自己都无法原谅的恶手,后面就一直很困难连坚持下去都很难,因为它实在太完美了,没有任何缺陷,没有波动我真的很责怪自己,没有下的更好一点我希望自己能做得更好一点,我觉得自己没能做到,因此我不想说这是个双赢的局面,我真的很难过可能和其他人的看法不同,我觉得真的很糟糕” 常昊九段解说称,人类对相对容易量化的感觉好一点,但对中腹部难量化的感觉要差去年与李世石对战的AlphaGo还有点人类的影子,现在的AlphaGo则完全走着自己的招法,人类很难预测 有趣的是,在最终较量中,AlphaGo走出一对的执子步意义不明的“怪招”,现场解说一度怀疑代其“扑克脸”黄世杰博士落错棋子 第二局过后,柯洁称AlphaGo2.0接近上帝,自己中途以为很接近胜利,但因为太紧张“后面又下了一些不好的棋”“棋圣”聂卫平则评价称,“柯洁想赢估计只能靠找到bug,或者我们派小鱼儿去拔个电源什么的” 除了连续三局战胜柯洁,AlphaGo还在团队赛中虐了一把人类在周五举行的团队赛中,由陈耀烨、时越、芈昱廷、唐韦星、周睿羊组成的队伍遭 AlphaGo“团灭”人类在开局阶段落后太多,尽管在收官阶段频频放出好手,但因前期差距始终不能弥补,最终仍没能抵挡住 AlphaGo,国手团队254手投子认输 不过,AlphaGo团队在第三局之后宣布AlphaGo退役,称本次中国乌镇围棋峰会为其参加的最后对弈比赛 Alpha Go2.0的自我学习远强于初代的深度学习 全天候科技日前指出,AlphaGo初代使用的是深度学习,需用数据训练机器人但AlphaGo2.0则可自我学习,能从自己跟自己的对弈中提升二者的差别相当于顶级大师和职业玩家中层水平的差距,所以柯洁才说“第一场不是我输了1/4子,而是机器只想赢我1/4子” 此次的柯洁对战AlphaGo和去年李世石对战的Alpha Go有什么区别呢首先,与李世石对战的AlphaGo初代使用的是深度学习法,通过不断的图谱和各类棋局的陪练,使得AlphaGo不断的获得数据,具备对抗各类局势的能力说白了,就是用数据来训练机器人,要知道AlphaGo训练时使用了超过16万个人类棋谱,在加上其建立在数据的基础上,又通过与自身的对战完成了3000万个棋谱的对决,最终得到了几万个模式用来对抗人类高手 但是,AlphaGo2.0则可以完全摒弃人类的棋谱,通过设定规则后允许人工智能程序从0开始,不需要依托任何外来数据和各种人类棋谱,就是凭借自身内部的不断对弈,然后发掘各类棋路和变数,从在不断的攻守之间推导出各类对决的方案和方法简单来说,就是不接受任何人类围棋经验,只需要知道规则,然后就自己跟自己对战,从对战的博弈不断学习和提升 围棋AI:人工智能发展的缩影 广发证券分析师张超在报告中指出,围棋AI的迅速发展是近年人工智能突破性一个缩影后者突飞猛进的原因主要有以下几点:算法的突破、数据的增长、硬件的发展和开源软件的流行 广发张超进一步指出,深度增强学习是AlphaGo的核心技术: 围棋AI的决策是一个增强学习的过程当前的棋局是状态,能否赢棋是奖赏,策略就是根据状态走子的决策方法AlphaGo通过两个深层神经网络解决了价值函数的估计和策略的计算,就是策略网络和价值网络通过价值网络与策略网络相结合的方式,AlphaGo摆脱了穷举法的庞大计算量;通过大量的训练,ALphaGo迅速成长,