围棋的未来在何方?——人机大战对围棋文化的影响研讨会

会议时间: 2016年2月16日9:00~13:00

主办单位: 国学网、光明日报

参会嘉宾:林建超(中国围棋协会副主席)
     邱运华(首都师范大学副校长)
     梁 枢(光明日报国学版主编)
     尹小林(首都师范大学电子文献研究所所长)
     韩立新(清华大学哲学系主任、清华大学围棋文化交流与研究基金会主席)
     孙茂松(清华大学计算机系主任)
     干春松(北京大学哲学系教授、儒学研究院副院长)
     王 元(《围棋天地》副主编)
     程广云(首都师范大学哲学系主任)
     刘知青(北京邮电大学软件学院教授、围棋软件开发者)
     邓瑞全(北京师范大学易学文化研究院副院长)
     方 铭(北京语言大学孔子与儒家文化研究所所长)

 

尹小林:

  我先介绍一下在座的各位嘉宾。

  林将军是中国围棋协会副主席,大家都认识,他在《围棋天地》发表的《围棋与国家》已经上了全国高考语文试卷,是围棋文化的领头人。

  邱运华老师是首都师范大学副校长,喜欢围棋,特别支持围棋活动。

  梁枢先生是《光明日报》国学版主编。

  韩立新老师是清华大学哲学系教授,也是清华大学围棋文化交流与研究基金会的理事长。他们已经在日本、韩国搞了一些围棋文化交流活动,可能以后还会在欧洲、美国搞活动。

  干春松老师是北京大学哲学系教授,研究领域是中国哲学和中国传统文化。

  程广云老师是首都师范大学哲学系主任,也爱好下围棋。

  方铭老师是北京语言大学孔子与儒家文化研究所所长。

  邓瑞全老师是北京师范大学中国易学文化研究院常务副院长。

  刘知青老师是北京邮电大学软件学院教授,这两天他一直在电视网络上讲解人机大赛。他本人就是搞围棋软件开发的。

  王元先生是《围棋天地》的副主编,职业八段,是在座中围棋水平最高的。

  孙茂松老师是清华大学计算机系原系主任,现在是书记。

邱运华:

  非常荣幸能够邀请到各位来座谈,这次我们人数不多,但都是各个领域的高人。我们前任校长曾经有个愿望,他说我们应该办教职工的围棋比赛,办北京市大学生的围棋活动,还应该出版一些围棋古谱,尽量使我们学校有文化一点。

  今天这个话题我觉得特别有意义,这是一个面向未来的崭新话题。原来国学网也主办过一些活动,比如《中国历代围棋古谱集成》,是面向过去的整理;“国学杯”是面向业余棋界的比赛,等等。而本次座谈会则是面向未来的一个活动,这是非常有意义的。能在这里来听一听各位的高见,我觉得是非常幸福的一件事情。

尹小林:

  各位嘉宾,我先把这次活动的缘起做一个简单陈述,然后大家自由发言。

  这次人机大赛的意义,已经远超主办方的设想。记得去年十一月份去韩国参加围棋活动,大家还在讨论围棋软件,去年在中国搞了一个计算机围棋大赛,当时最好的围棋软件的水平,职业棋手要让五到六个子,所以许多人认为五十年之内计算机下不过职业棋手,甚至有人说这辈子都见不到计算机在围棋上战胜职业棋手的这一天。今年二月,樊麾战败这件事一出来,围棋界就炸锅了,樊麾是职业二段,计算机5:0全胜。后来就是三月李世石与AlphaGo大赛,它的影响已经超出了围棋界,超出了科技界,更大程度上也是一个文化事件。今天我们这个会议的范围很小,但是有围棋、科技、文化三个方面的代表。

  这几天我看了大赛的棋谱和一些媒体的报道,有三点感受。

  第一个感受是强者至上。在围棋界,谁的水平高,谁就拥有更多发言权。此前计算机软件水平不高,没有多少发言权。这一次AlphaGo软件出来以后,职业棋手就开始谦虚了。

  现在讨论比较多的,把计算机叫做围棋上帝。从某种意义上讲,计算机就是代表上帝和人在下棋,我的第一个感受就是计算机太强大了。

  第二个感受是大道至简。最大的道理是最简单的。今天我们还请了《周易》方面的专家,《周易》的“易”与对弈的“弈”是同音的,在古汉语里面,同音往往同义。当围棋这么复杂的游戏可以简化到用二进制来表述的时候,它就与《周易》相通了。

  原先我们认为围棋变化太多,无法计算,但是当我们找到一种算法时,情况就变了。前两天一个搞计算机的朋友跟我透露了一个信息,他说现在AlphaGo已经找到一种基于图像的算法,直接计算棋形的面积,计算双方棋子的面积。大道至简,最复杂的东西用最简洁的方法来表示,这就是计算机的基本原理。

  第三个感受是弱势平衡。世界上不能只有强者,弱者是和强者共存共生的。比如王元老师是职业八段,我是业余3段,如果他让到五六个子的时候,我们双方力量就平衡了。实际上我们的文化也好,围棋也好,周易也好,中医也好,都在讲平衡。这次人机大战很大程度上是在逼迫我们去思考历史、现代和未来,我们需要从文化的角度上去思考这次人机大赛的意义。

  我先讲这些,抛砖引玉,主要是听大家的发言。

刘知青:

  上海日报有一个退休的高级记者叫胡新梅,曾经做过多年的围棋报道。前年的时候找到我,我写过一本《现代计算机围棋技术》,讲得其实就是AlphaGo一些基本方法,还有一些创新放在后面。他看这本书以后觉得非常有意思,就说我们来做一个对话吧。他是从文化、围棋的背景,我是在人工智能的背景,这样做了一个对话录。那本书里面,我们做了一个大胆预测,我说计算机围棋会在五到十五年之内战胜顶尖职业棋手。这个可能是当时最大胆的预测了,没有人相信这个预测。去年十一月份的时候举办首届计算机围棋锦标赛,我们几个当时也做了一个沙龙讨论,去预测什么时间能到达这个点。普通的研究人员也都是认为十五到二十年,那是在去年十一月份。其实去年十月份AlphaGo已经战胜樊麾了,但当时还没有公布,这件事公布是在今年一月二十八日,他们的文章在顶级科学杂志《Nature》上发表,公布了这个事实。这远远超出像我从事这个行业的一个最乐观的估计,所谓乐观的估计还是显得悲观了,不是五到十五年,而是五到十五个月已经完成这个事情了,这是科技的一个重大突破,当然它对围棋也有一个深远的影响。我想我就先说这么多,也请各位教授专家从文化角度更深地去解读这个事情。

  首先呢,《Nature》那篇文章非常重要,我仔细读过它,那篇文章指出了一个很明确的方向,但是它没有公布细节。细节也没有办法公布,如果公布细节的话,那就不是十页纸,而是要占一百页纸了。它不公布细节,所以别人要复制那些细节还是需要一定的工作量,我们的团队其实已经开始复制这些技术当然有些细节,有些参数都是要重新去摸索,我觉得田渊栋还需要摸索一些细节。要掌握这个技术,即使公布了方向,就像知道要这样做才能爬到珠穆朗玛峰,但你按着方法去爬,也不是十天半月能够做出来的东西。

  那么这个团队,我们可以看到,是非常大的一个团队。他们发表论文就有二十几位作者,都是长期从事计算机工作的博士专家,最前沿的学者。可以想象它的工程师团队人数,乘以二或乘以三都是有可能的。而且他们做了两年,主要人员都有十多年的计算机围棋研究背景,有十多年的积累。罗马不是一天建成的,怎么也不可能说十五天就可以完成复制,这是不太现实的,我不大相信这个论文一出来,十五天就能够把它复制,里面有很多细节还需要摸索和积累。

  阴谋论总是有的,但我看他们的论文,非常有说服力。而且,世界上能够这样战胜李世石的,应该是没有的。在现场它不可能去作弊,它下棋的方法也不是人的方法,它做了很多像我们看到的交换,我们看来都是俗手,这些小细节不是最优,但它仍然可以碾轧李世石。李世石唯一一盘的翻盘,只是计算机在那个时候犯了一个错误,而这个错误其实是它使用技术的一个特征。它使用这种技术,其实就是有这个错误,是算法本身的缺陷,只是说平常这个东西没有这么复杂,没有这么大的压力,没有显现出来。当时是一个很复杂的死活计算问题,计算机就把它算错了,这个弱点恰恰说明这是一个软件,是一个计算机。而且它的强项也是计算机的强项,不是人的强项。整个过程应该还是一个非常有说服力的技术的展现。

韩立新:

  自从谷歌这个论文发表之后,很多人就要去进行模拟验证,根据它提供的突破点去编程,弄出来的程序都达到了业余五六段的水平。这些在过去都是不可想象的,当然我估计也不是那么简单,可能前期也有做过研究,但是能达到这个水平是有可能的,不见得能够怀疑科学。

孙茂松:

  五六年前,微软有一个华人学者,是清华出去的,负责微软的语音识别项目。他是湖南人,兼湖南大学的教授,当时天河一号应该在湖南大学放了一套系统,他就想做点事情,与我商量说能不能做个围棋软件。当时我觉得围棋太复杂了,业界共识都一样,太复杂了。当时确实没有好办法,它的搜索空间太大了。我大概算了算,纵横19道,361点,每个点都有白子、黑子、无子三种可能,这就是3361。算下来一盘棋有10172种可能。

林建超:

  这是沈括在一千年前记载在《梦溪笔谈》里的,其实理论上还要比这个数字大得多。沈括当年不能掌握的,一个是组合的方法,第二个是满空间的算法,第三个是黑白双方运行,而且他不知道重复提子,这些东西当年都没有计算在内,所以一个点不是三种可能,是更多种可能。拿现代的高等数学来计算,由数学博士生导师、计算机专家组成一个组算了三个月。沈括的那种算法就太简单了,那是一千多年前中国人的智慧,在当时是全世界最高水平。现在来说,由于围棋技术的发展和围棋实战经验的积累,使大家认识到围棋里有更多规律性的东西,所以不是那么简单的。

孙茂松:

  反正很复杂,我算了算这个复杂的不得了。而且这里面还有一个问题,你必须把人类下得比较好的棋盘给它送进去,做机器学习,才有可能。但是中国大学里面你要去做这个工程是很困难的,几千万棋盘要送进去。所以当时真是没有好办法,大学没有这个工程能力。谷歌它肯定有这个工程队伍,才能把几千万个棋盘给送进去。再一个国内科学体制下没有办法拿到这个经费,做个围棋的你给我三千万,没有结合国家重大需求也拿不到。所以当时就没敢做。但是到最近两三年的时候,卷积神经网络出来,当时我的第一直觉就是:围棋可以做了。因为卷积神经网络这几年在语音识别、图像识别上的进展是突飞猛进。这个网络模型本身很简单,稍微讲一讲可能半个小时就搞明白了,但是它的参数很多。语音识别现在做到什么程度,它的错误现在大概在9%,以前要高得多。图像识别,现在国际上有一个公开的图像识别比赛,当然用计算机来比。大概就是任意给你图像,你把它分到一千类里的一种。人的错误率大概是5.1%,但机器大概能做到3.5%。这个是现在包括谷歌,包括微软,包括百度在激烈竞争的一个领域,也是用卷积神经网络。这个卷积神经网络,就是输入一张图片,一个最简单的图片,64*64的一个点阵,比围棋要复杂的多,围棋不就是19×19么?而且围棋就是黑子、白子、无子三种可能,它不是。

刘知青:

  我再补充一下。如果简单的说围棋有多少种状态,沈括就算出来了,但围棋不仅仅是个状态,它还是个过程,“劫”就是一个过程问题。当你把它看作时一个过程的时候,复杂度就远远超出沈括的计算了。

孙茂松:

  图像识别,机器来看,就是一个格子上面有点,点上有黑白,到底是什么东西,机器也不知道。但我最后要告诉机器,我要让机器说出来这是一个人、一个麦克风或者一个杯子,我们叫语义宏构化,这个任务也含有挑战性。因为一个杯子可以千奇百怪,某种意义上来说,这个任务可能比围棋还要难。

韩立新:

  不好意思打断你一下,是不是说在图像识别这个技术上,人工智能已经比人类高?

孙茂松:

  对。别的我不敢讲,它这个是很科学的考量任务。把物品分一千类,然后给一张照片,你可以把它归到杯子那类,也可以说是别的,给五个答案去选。这个条件下,现在机器做的要比人好。因为一千类,有很多东西其实人可能不认识,比如问这个花是什么花,你可能不认识,机器有大数据的能力,就会做的比较好。

  反正不管怎么样,以前做这类任务都是很差的,像语音识别,倒退十五年,识别的准确率几乎是零,到现在能做到只有9%的误差。所以卷积神经网络这个东西一出来,这个模型是一个通用模型,并不是只针对某个任务,拿这个图像数据去训练,它就能把图像识别做好,拿语音的去实验,就能把语音识别做好,用围棋数据去训练,就能把围棋做好。

  所以用卷积神经网络去做策略,这个算法很简单,只要有机器,跑一下就出来了。它根据整个盘面去计算,所以可以掌握所谓的“大势”。但这个大的局面,它自己其实并不知道,它就是靠算法,最后整个神经网络算法,就变成一个函数。网络本身可能很复杂,但整个结构非常非常简单。输出是什么呢?输出就是下一步棋,你落在哪个格子里。它就去算这个概率。刚开始所有的参数都是随机给,但当前这个盘面,黑白这个是定势,对吧?这个是有的,所有的参数往上算,算到最后那个输出端,然后它去算落在每一个格上的概率。刚开始它不准,靠数据去重新反向训练神经网络,最后只要给个棋盘,我保证下边落在人类专家放的那个位置的概率是最大。这个训练很简单,但是国内为什么做不了,因为没有那么大的计算能力,谷歌有这个能力。这一块其实就是机器学习最近若干年发展的一个必然趋势。

林建超:

  谷歌的硬计算能力并不领先。在超算能力上,中国实际上在十几年前就拿到了世界冠军。美国人现在领先的并不是硬计算能力。

孙茂松:

  实际上是机器学习方法理论的突破,如果没有机器学习理论上的突破,即使把中国最强大的计算机拿过来,你在原有的框架来做,它现在也下不过四段五段。它这个搜索能力实际上是需要在现有的基础上,比如现在搞个计算机,比现有的计算机计算速度快一万倍,也丝毫不解决问题

  实际上算法突破,理论突破是必须的。你看蒙特卡洛搜索,其实都是这些年的理论贡献,但真正怎么把东西给做出来,这个事情还是不容易。像FaceBook技术团队很强大,它的老板也是做机器学习的几大巨头之一,但它就是做不过谷歌。所以这个应该不存在作弊问题,因为它这个模型一旦训练完之后,它在运行的时候,人无法控制,除非是彻头彻尾的,赤裸裸的作弊。训练之后,设计者都不知道它下一步会下出什么样的棋。所以理论上不存在作弊的可能性,而且以谷歌在学术上的声誉,应该不会做这种事。

尹小林:

  我想问一下,AlphaGo在每次运行时,有没有可能调参数?比如前三盘我用100%的运算能力,后两盘调到90%或95%,就是一盘棋下完了以后,下一盘可以调整一些参数来改变棋力?

刘知青:

  这是完全有可能的。AlphaGo调参数来测试人的棋力,我觉得是完全有可能的。其实它有单机版,也有分布式版,这两个水平不一样。谷歌把AlphaGo跟李世石的比赛看作是对其自身技术的一个测试,而不是一个纯粹意义上的比赛。李世石相当于AlphaGo的一个高级测试员,主要是去测试这个机器的能力。

孙茂松:

  参数确实可以设。比如蒙特卡洛搜索,原来采样是1%,我这回调的第一点,采样0.1%,速度就快。再一个它单机上就可以算了,实际上是它搜索的能力会降低。但这个模型一旦训练出来之后,基本上就不会改了。模型也是花了几个月好不容易训练出来的,局部一改,会变成什么样完全没办法估计。

  所以实际上这个东西可以做,能做的不错,我们可以事先就估计到,但能做的这么好,确实没有想到。机器出来以后,弄个四段五段,这个可能性我们觉得是有的,但是能和人类顶尖高手,特别是在整个布局和局部绞杀那一块儿,能够考虑的那么细,这个我真是没有想到。

  另外说它有BUG,我认为不是BUG的概念。第四盘输了,有人就说有BUG,其实是它系统本身在评估的过程中就可能出现这个问题。就比如它这个搜索,随机搜索就真的是随机搜索。最后在若干步骤里面的正确解好像就只有20%的概率点,反正不是100%,它那一块儿本身就有可能出问题。正好遇到靠随机搜索搞出的解不是最理想那种状况,就可能会出问题。

  勾股定理的发明人毕达哥拉斯说:“数字是宇宙的统治者。”围棋几乎没有规则,全是靠计算,最终结果全是一组一组的数。所以AlphaGo输棋不是BUG,是其模型本身的性质,可能出昏招,也可能出奇招。搜索空间这么大,人类棋手实际上形成了一种人类高级智慧所确定的搜索范围,搜索空间大大缩小。而AlphaGo则是全空间搜索,有可能出一些人类无法想像匪夷所思的奇招,有可能触碰到人类惯性思维的盲区,对我们下棋会有所启发。

  这个模型除了围棋,还可以做很多事。比如我的学生运用类似模型研发程序,训练计算机作古诗。试举一例,上句古人诗云“江上西风一棹归”,下句计算机续曰“夕阳不见客舟低”。再举一例,上句古人诗云“又听西风堕叶声”,下句计算机续曰“万事尽随天籁起”,又续云“天涯游子不胜情,江山满眼愁多少,剩有心事绪未成”,意境、平仄、韵律都还不错。这个古诗程序是在五十万首古诗的数据基础上,运用回归神经网络(Recurrent Neural Network)研发的。回归神经网络适合做语言,而卷积神经网络适合做图像。只要提供充分的训练数据,这些训练数据其实是人类知识的体现,加上优秀的算法,人工智能围棋的水平提升是必然的。

  计算机固然可以做很多事,但若让计算机到厨房炒菜,想必就很困难了,因为环境太过复杂。围棋则相对简洁,棋盘纵横十九道,色分黑白,输入输出都非常确定,特别适合计算机做大量运算。归根结底,计算机体现了人的智慧。

  

Comments are closed.