智东西(公众号:zhidxcom)
文 | 海中天 翰阳
决战之日即将到来。
下周,韩国九段顶尖中国围棋高手李世石(Lee Se-dol)将与谷歌人工智能项目AlphaGo在首尔四季酒店展开对决,整个比赛分五轮进行(这是你要了解的第一件事)。
赛程:3月9日、3月10日、3月12日、3月13日、3月15日。
规则:贴目7.5目(向后下棋的选手贴目7.5目)。每位棋手各有两个小时的布局时间,3次60秒的读秒。
奖金:100万美元;谷歌已经表示,如果AlphaGo获胜,奖金将捐赠给联合国儿童基金会(UNICEF)、STEM教育及围棋慈善机构(Go Charity)。
P.S. 贴目是围棋术语。指黑方由于先手,在布局上占有一定的优势,为了公平起见,在最后计算双方所占地的多少时,黑棋必须扣减一定的目数或子数。中国采用的是7.5目的大贴目规则,日本、韩国则为6.5目。
双方都撂狠话:我们必胜!第二件事是,到目前为止,双方都深信自己将赢得胜利。
2月22日,李世石在首尔韩国棋院接受赛前采访时说:“老实讲,Pan Hui和AlphaGo的比赛水准没有达到我与AlphaGo比赛的水平。我听说AlphaGo一直在升级,就在我们谈话时它还在继续进步,所以说,相比于10月的比赛,我所面临的挑战会更大。尽管如此,我占据优势的事实是不会改变的。对我而言胜利是一定的,现在只剩下赢得完美不完美的问题了。”
谷歌DeepMind却表示,人工智能程序有自动学习的能力。
DeepMind工程总裁Demis Hassabis在2月初曾表示:“实际上整个比赛就是我们的Deep Blue时刻。” Hassabis还说,大多的围棋玩家都认为李世石将战胜AlphaGo,Hassabis补充道:“他们认为我们获胜的机率只有5%……但我们的系统进步很快,这点是他们没有意识到的。就在我们谈话时,它正在进步。”
对于Hassabis而言,AlphaGo项目的意义并不仅仅只是打败世界级的围棋选手。开发AlphaGo程序的方法可以应用在其它人工智能项目中,包括无人驾驶汽车、类人虚拟助手。“我们认为人工智能正在为这些问题提前解决一个元问题。”Hassabis说。
AlphaGo怎么运行的?这是第三件事。
许多人很好奇,到底是什么让AlphaGo变得如此成功?难道其它人工智能就失败了吗?
“传统搜索树会考虑所有可能性,但它用在围棋上行不通。” Hassabis说。正因如此,谷歌DeepMind团队才用两套神经网络为AlphaGo开发了一个全新的系统。我们可以将围棋视为一个包涵所有可能性的树,它能够无限延伸。AlphaGo要做的就是利用两套神经网络来缩小可能性。它会利用策略网络来判断什么行为可能性最高,系统应该考虑怎么走好下一步。AlphaGo会将搜索树的宽度变窄。还有一个就是价值网络,它告诉AlphaGo怎么移动对白子和黑子都更好,这样就可以降低可能性的深度。
在行动之前,Deep Blue超级电脑要考虑大约200万步,AlphaGo却只需要考虑10万步。机器比人类专业选手考虑得远,人类只能向前看1000步。DeepMind分别对两套神经网络进行训练。
策略网络可以模仿职业围棋选手下棋,然后让电脑下棋1300万次来改进系统。最终。DeepMind会从每一个集合中挑选黑子或者白子的一边,从而组建一个新的数据集。接下来价值网络上场,DeepMind会利用好数据集,让它来决定棋局中每一个位置上谁会获胜。由此开始,DeepMind团队会将两个网络结合,用Monte Carlo树搜索来搭建最终的AlphaGo。“AlphaGo就是一个系统,它可以自己学习,然后将学到的东西写成算法。事实上,它跟人类学习和下围棋很接近。”Hassabis解释说。
有些高深莫测?其实,你可以认为AlphaGo就是一个实验,它不是编程程序,事实上连AlphaGo和它的自己创造者都无法解释其是如何下棋的,但它却是拥有了这种能力——或许这是一种直觉,通过不自觉的推理得到知识——到现在为止,我们普遍认为这是属于人类的特权,就如牛顿在其《自然哲学的数学原理》第二版中序言中所写到,“我不做假设,我只是知道。”
P.P.S. 关于AlphaGo的演示视频我们没找到,但我们找到了一个Facebook类似项目的。尽管没有谷歌的NB,但凭借11万次的运算,其在著名的覆盖全球的网络围棋社区KGS的年度比赛中拿到了第三名。
人工智能下棋,大概就是以下这个视频中展示的样子:
是博弈也是试验我们需要思考的更多一些,这是第四件事情。
人工智能是否能够战胜人类大脑?这个问题已经争论很久了,不论围棋大战谁胜谁负,它都将为问题的答案奠定基础。
如果李世石获胜,某些人可以轻松地长舒一口气了,因为他们之前曾担心人工智能会入侵到人类占据统治地位的一些领域中去。如果AlphaGo获胜会怎么样呢?它可能会向我们描绘出一个反乌托邦的未来,在那里人类可怜无助,像牵线木偶一样被机器人大脑控制着,正如科幻电影《机械公敌》描述的一样。
开发AlphaGo的是谷歌DeepMind,它原本是一家英国公司,2014年时被谷歌收购。DeepMind认为电脑会进入到一些需要进行创造性思考的领域,这预示着未来人类和人工智能的关系会变得更紧张。
许多专家认为要想知道人工智能是否真的具有创造性思维,围棋是最好的测试工具,因为它依赖直觉、非常复杂。在其它领域人工智能已经超过了人类,包括国际象棋——1997年,IBM的超级计算机“深蓝”便打败了当时国际象棋的世界冠军卡斯帕罗夫。但在围棋中,棋子可能的位置数比宇宙中的原子数还要多,并且远远超过国际象棋棋子可能的位置数——这一领域,仍然被人类所支配着。
最后一件事情是,你这回可以亲自见证这个历史时刻。
据悉,这次谷歌AlphaGo与李世石的对决将通过YouTube进行直播(在DeepMind的官方频道,其已经上传了与欧洲围棋冠军Pan Hui的比赛视频),据传在国内也会通过视频网站和电视进行直播。英语解说将由迈克尔·雷德蒙(Michael Redmond)来担当,其是西方世界唯一一位达到最高级别专业9段的围棋选手。而韩语解说则为张赫宇(Chang-hyeok Yu),目前其是韩国围棋国家队的主教练。
而如果你想更深的了解AlphaGo,那么下面这篇深度内容不应该错过。几天前,Facebook人工智能组研究员田渊栋博士在知乎专栏上更新了一篇文章,详细分析了谷歌在《自然》杂志上发表的关于AlphaGo战胜人类围棋选手的论文,在智东西(公众号:zhidxcom)回复关键词“FBAI”阅读全文。