“你和对方打心理战,一开始就错了,肯定是被顾莫杰的计策坑了。”
“咱阿尔法go,也能做到120手之后全放手——如果中间双方没有大规模打劫、换子、被吃等导致盘面过于空下来的情况——而初音比我们谷歌的团队更懂围棋,起步也早半年,价值取舍算法肯定也有优势,估计顾莫杰下到100手之后就彻底双放手了,后面的苦思冥想都是假装给你看的!”
“顾莫杰那套机器肯定也和我们的阿尔法go一样,有‘告诉使用者当前所走的步骤是否是权衡利弊之后为了节约时间而拿出的权宜之计’这个功能,所以顾莫杰也绝对不可能每一步都在那儿思考的。所以那些你觉得一个专业棋手应该马上做出判断的步数,他肯定也是装给你看思考的。”
一群连夜被李世石接见的谷歌工程师,趁着饭桌上的功夫,叽叽喳喳给李世石科普了不少东西,听得人心烦意乱。
在李世石想暴躁之前,还是跟他来观战的韩国棋院梁院长开口打圆场:
“好了,黄教授,这种事儿就长话短说吧。毕竟李九段还要休息,今天下了一天棋已经很累了,9点之后就必须放空大脑。你们只有两个小时,没用的就别说了。”
谷歌那名来自湾湾的价值权衡算法负责人,被称作“黄教授”的,立刻住口了,也让手下的讲解员住口。
“不好意思,刚才这些也就是随口一说。充分了解对手,也是在帮助李九段赢得胜利么。后面,我们今晚还是重点讲讲阿尔法go明天能够带来什么好处、如何与李九段合作吧。”
黄教授说着,示意李世石别耽误时间,一边吃一边听就好了。
李世石也不和他客气,其他人在那儿围着他聊,他抓紧时间吃晚饭。
江南会提供的伙食,那也绝对是华夏料理的巅峰,为了不落口实,这几天对李世石的招待可谓是极尽奢华。但龙肝凤髓吃在嘴里,李世石都觉得没什么味儿。
还不如赢比赛的时候灌两口辣泡菜痛快。
黄教授和他的助手依次给李世石讲解:
“阿尔法go虽然不如初行完善,但是官子肯定是没问题的。想你们今天这盘棋下到220手才分胜负。实际上170手之后的最后50手,如果双方都是机器人,结果肯定是下多少遍都不会变的,而且只要15分钟就能下完那50步。”
正常人类下围棋,最后50手双方加起来怎么也要1个多小时,而机器人15分钟搞定,相当于起码可以比人类下棋节约1个钟头的总比赛时间。
这些时间就可以更好地分配到前面的步骤中去,每人多半小时思考。
至于第二天具体李世石走到多少步之后彻底双放手交给阿尔法go,李世石准备吃完饭稍微和阿尔法狗试几个150手左右的中盘残局——从他本人历史上和对手下的比较胶着的棋局中挑——来试试看阿尔法go的水准。
“另外,阿尔法go在布局阶段也谈不上什么能力,只能是给你一些参考定式,你看了之后挑出其中最好的一个结果就行——我们只能保证,最好的结果肯定在那个八屏选项之内,但是具体是哪一个,阿尔法go判断不出。”
“阿尔法go也有做‘价值判断网络’这个工具,到时候在给出机器意见之后,会在屏幕上打出一个判断,告诉你‘这一步是绝对不可能有更好的解法’了,还是‘机器也不知道谁最好,只是没时间想暂时觉得这个最好’。所以那些机器肯拍胸脯告诉你这就是最佳答案的步骤,你也可以省掉一些思考时间。”
李世石听到这儿,停下了筷子,亲口向黄教授确认了这玩意儿的运作法则。
黄教授也不藏私,坦荡地告诉他:阿尔法go里面其实是有两套走子算法的,第一套是绝对穷尽最佳可能性的算法,但是耗时非常巨大。哪怕以如今谷歌的云端服务器群和积累的棋局大数据,也要很久才能算一步棋。
毕竟,围棋是如今人类传统棋类运动中,计算量最大的。围棋的可能性相比于国际象棋和象棋,根本就是一个天文数字。
所以,阿尔法go的深度学习,主要还体现在一点上:发现算法一会严重超时的时候,它会做出一个省时的判断,下一个不算太差的子。而这种猴版省时算法只要第一类穷尽算法的数百分之一时间就够了。
李世石吃完饭,用了点茶水,略作休息,就和黄教授的团队钻研起磨合之法。
不过,他终究是没办法和顾莫杰那样的人工智能本领域大能,比试对人工智能的理解程度和配合程度的。
多年形成的习惯,更不是几个晚上可以扭转。
临阵磨枪一番,最后也不过是让李世石在第二天的比赛中省出大约1个小时的思考时间、节省了不少脑力。
就像一个考高数的考生,被允许带计算器。但是计算器并不会解高数题,只能帮答题者省点时间,减少些低级错误。
……
全世界的目光,继续凝望在江南会这一片池馆雅阁之间。
数十亿人次的曝光量,形成了比世界杯决赛还强的高光时刻。
谷歌出手了!终于不是人机打真人,而是人机打人机!
双方都是最终完全体的终极对决!
12月23日,第三战!
顾莫杰执黑,回到了古力流的“对李先行大胜率”模式。开局一阵天马行空的猛烈布局,把李世石的发挥空间骤然限缩了二三十手,也让顾莫杰微微松了口气。
随后