欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

哈萨比斯:AlphaGo第87手才注意到第79手失误

程序员文章站 2022-06-30 20:01:33
DoNews 3月13日消息,李世石今日首胜AlphaGo,AlphaGo创始人德米什·哈萨比斯(Demis Hassabis)在赛后发表推特对李世石表示祝贺,同时,他今日还在比赛中对赛...

哈萨比斯:AlphaGo第87手才注意到第79手失误

DoNews 3月13日消息,李世石今日首胜AlphaGo,AlphaGo创始人德米什·哈萨比斯(Demis Hassabis)在赛后发表推特对李世石表示祝贺,同时,他今日还在比赛中对赛况进行了分析。

哈萨比斯称,AlphaGo在下到第79手时出现失误,但它直到第87手之后才“意识”到自己出现失误。他解释,这里的“想法”和“意识”只是指AlphaGo价值网络的输出值(注:即对价值网络的判断,每一步AlphaGo都会做一个价值判断)。在79手的时候,这个输出值给出的判断是这手棋的价值在70%左右,到了87手之后,输出值开始呈现直线下降趋势。

人机大战第四场:李世石获首次胜利

(来源:媒体)

AlphaGo在下到87手的时候,出现了困惑,自此,AlphaGo陷入到麻烦当中。

哈萨比斯称,他们非常高兴看到李世石今天优异的表现,他让AlphaGo犯下了一个无法挽回的错误中。

在本场比赛前,AlphaGo已经在本周三、周四以及周六,接连三场战胜了李世石。

鉴于三场连败,赛前多数人对此场李世石获胜并不看好。此场获胜转折点是在李世石长考执白出78手之后,李世石的这一手,将AlphaGo下出了Bug,找到了AlphaGo的极限,出现了它算不清楚的地方,此后AlphaGo接连使出系列晕招。在下午的四点三十分左右时间,AlphaGo认输,李世石也迎来三连败之后的首次胜利。