AlphaGo击败韩国棋王 “人类2.0”不再遥远

谷歌DeepMind开发的人工智慧软体AlphaGo(阿发狗)以四比一击败韩国棋王李世石,揭示人工智能的新里程碑。“阿发狗”的重要推手是兼具围棋手与程式设计师身份的台湾专家黄士杰。这次世纪对弈,是人类历史的一次分水岭。人类的进步在于可以发明一个人工智能系统,而这个系统经过“深度学习”后,可以取代或操控人类,未来甚至可以消灭人类。这是人类的胜利,抑或是人类的失败?

一九九七年,在IBM开发的“深蓝”战胜西洋棋世界冠军卡斯帕罗夫之后,美国《时代》(TIME)杂志提出了一项新的挑战:让电脑与人类下围棋吧,围棋深奥、复杂,无规则可循,它获胜的机会很小。“电脑要在围棋上战胜人类,还要再过一百年,甚至更长的时间”。结果《时代》预言失准,不消二十年,由谷歌(Google)旗下DeepMind公司开发的人工智慧软体“阿发狗”(AlphaGo),三月九日起三度在首尔击败围棋九段的韩国围棋名将、十八度荣获世界棋王衔头的李世石(又称李世乭),震动全球。

连吞三败仗之后,十三日李世石终于结束一路挨打的局面,扳回一城,替人类扳回了一点颜面。但十五日最后一战,双方厮杀近五小时后,阿发狗演出逆转胜,李俯首称臣,最后以四胜一负称霸人机大战。

韩国围棋协会也在赛后宣布,阿发狗获颁荣誉职业九段,此为最高等级的“神级”头衔,之前从未有人或机器获颁此级数。

阿发狗打败全世界顶尖的围棋高手,被认为是人工智能(Artificial Intelligence, 简称 AI)的里程碑。这次世纪对弈,是人类历史的一次分水岭,也是一个吊诡的发展。人类的进步,在于他可以发明一个人工智能系统,而这个系统经过“深度学习”后,可以取代或操控人类,未来甚至可以消灭人类。这是人类的胜利,抑或是人类的失败?

这次电脑人脑对弈全球瞩目。事实上,人机大战早在二零一三年就上演过,法国学者Rémi Coulom 开发的“疯狂石头”(Crazy Stone)跟日本围棋九段石田芳夫对弈,石田芳夫让了四子,结果这位曾经五连霸本因坊、有“人间电脑”封号的世纪围棋高手居然输给了电脑。专家指出,不论下象棋、西洋棋或围棋,人脑已不如电脑。

近二十年,人脑发展有限,人工智能突飞猛进,如语音辨识、影像分析、语言导航、无人驾驶、自动翻译等;在医学方面,人工智能更是厉害,机器能协助医师判断心电图、监测生命迹象、协助判读CT、X光中的肿瘤大小。医师戴志融认为,在《星际大战》(Star Wars)中医疗机器人帮人开刀、接生的画面似乎已经不远。人们受惠于人工智能新科技,可一旦人类失去人工智能掌控权时,后果将会不堪设想。

电影对未来世界的描述,充满想像力。《骇客任务》(The Matrix)描述:二十二世纪时,具思考能力的人工智能已经主导了人类生活的许多层面,足以与人类分庭抗礼;两者关系紧张。某日,人类为了夺回电脑的主控权,对人工智能进行攻击,不料夺权失败,人工智能战胜了人类。从此,主从易位,人类成为电脑的奴隶。

科幻小说界早就有反思,人类会制造一些怪物,最后会压倒人类,乃至消灭人类。人工智能的中心问题就是“生存危机”,很多专家忧心,人工智能若被用于邪恶,可能毁灭人类。好莱坞惊悚片《超验骇客》(或译《全面进化》,Transcendence),就是在诠释人工智能发展的危机。该片在电影院上映的同时,著名物理学家斯蒂芬•霍金就说:“人工智能或许不但是人类历史上最大的事件,而且还有可能是最后的事件。”其意思是:人工智能可能会导致人类的灭亡。

微软创办人比尔.盖茨也说:“未来的几十年,人工智能会强大到足以引起人们的关注。我同意马斯克(电动车Tesla与太空探索科技Space X的创办人)和其他一些人的说法,不明白为什么有些人并不关心。”盖茨所指的是马斯克最近表示人工智能“可能比核武器更危险”。

虽然有人指出,人工智能未来可能导致人类被机器主管,进而遭到毁灭,然而以目前的情况来看,人工智能可能造成的最大危机却是人类的脑袋变得愚钝。许多工作将由电脑取代,光是数据的失误率,人类就远远无法企及;办事效率亦然,毕竟只有电脑能够二十四小时不眠不休地工作。这虽然为人类带来空前的便利,却也引发许多忧心的声音:大量人口失业是其一,人类的颓靡更是个潜在的问题。如果人工智能的科技能够满足人类一切基本生理需求,那么人们是否会就此一蹶不振,失去了追求更高自我实现的动力?其实这类精神层次的疑问,人类的水准远远超出人工智能。

台湾业界对人工智能的发展相当乐观。宏碁电脑创办人施振荣表示,“人类2.0”时代将来临,台湾将在AI程式扮演关键要角。未来AI的主导者仍是人类,并将把人工智能整合到产业4.0,及智慧城市、智慧家庭及智慧生活的发展中;而新一代要面对与学习的新课题,则是学习将人工智能整合到物联网、智联网的发展应用中,未来科技也将朝让人类更容易驾驭人工智能的方向前进。

趋势科技董事长张明正则说,电脑连三胜世界棋王,这不仅是人工智能发展的突破,更影响到整体科技产业的发展,因为人工智能可说是下一代科技人才的“圣杯”。

电脑打败围棋王,台湾也与有荣焉,因为帮阿发狗下棋的棋手是台湾土生土长的资讯工程博士黄士杰,这名阿发狗最重要的幕后推手,已经在人类历史的里程碑闪耀光芒,是“正港”的台湾之光。

黄士杰专研围棋程式

今年三十八岁的黄士杰本身也是围棋高手,九年前就已经具有围棋业余六段资格。开发阿发狗的DeepMind公司今年一月于科学期刊“Nature”发表阿发狗研究论文,黄士杰即为第一作者之一,是影响阿发狗发展的关键人物。

不只棋艺精湛,黄士杰更专精于人工智能领域,硕博士论文都在台湾师范大学资讯工程研究所教授林顺喜指导下完成,分别是二零零三年硕士论文《电脑围棋打劫的策略》和二零一一年博士论文《应用于电脑围棋之蒙地卡罗树搜寻法的新启发式演算法》,这篇极富创意的论文,他呕心沥血花了八年工夫才完成,像是开启围棋对局的钥匙,对围棋程式开发起了关键作用, 二零一二年并荣获台湾电脑对局学会博士论文奖。

师大教授林顺喜表示,他的学生黄士杰使用“蒙地卡罗树”最重要的意义是,他大量搜集网路的高手棋谱、棋型,并写程式整理,统计其胜率,这次比赛可以派上用场,这是他所擅长的部分,否则阿发狗下的棋可能很平庸。

研究所是黄士杰围棋程式开发的养成训练所。林顺喜表示,黄士杰留在他的实验室长达十年,念完两年硕士班,先当国科会研究助理一年,接着考上博士班,原本第五年就可毕业,但他边写论文,边参与全世界对局比赛,累积实战经验,起初成绩平平,借由国际交流,与各国电脑高手脑力激荡,对他获益极大,却也占去相当多时间,博士班因此读了八年,但本身实力的培养却相当扎实,到了二零一零年终于尝到肥美的果实,他所开发的围棋程式Erica一举击败了当时围棋AI公认最强程式Zen,并在日本举办的“国际电脑奥林匹亚竞赛”中荣获十九路电脑围棋金牌,掀起轰动。

林顺喜表示,日本Zen程式设计师尾岛阳儿得到很多团体赞助,本身就专注在程式开发,但台师大经费有限,指导教授没有很多钱可以“养人”,只能用现有的学生做研究课题,双方资源天差地别,在刻苦耐劳环境下,黄士杰得修课、发表论文,每个月只领国科会几千元新台币,没有额外金援,几乎是单枪匹马与国外强大的研发团队比拼。他说:“黄士杰非常勤奋,很努力在改他的程式,研读非常多的idea,加上自己的idea,有时候一天工作十六小时。”

打败Zen之后,黄士杰一战而红,二零一一年六月口试通过,马上被加拿大Alberta大学延揽,担任研究员。林顺喜表示,一般从事围棋程式开发者,多数仅懂程式,棋力有限,但黄士杰同时精通两者,而且他围棋的知识在整个谷歌团队是最好的,是世界少有人才,使他大受重用,所以去年十月阿发狗对欧洲围棋冠军樊麾、这次对李世石,都由他担任操作员。

具专业技术的黄士杰在业界急速窜起,隔年十一月获专注于开发人工智能的英国DeepMind科技重薪挖角,担任资深研究员。二零一四年,DeepMind以四亿美元被谷歌收购,黄士杰和另一伦敦大学教授David Silver并列两大首席设计师。阿发狗打败韩国棋王展示重大技术突破后,谷歌三天内公司市值增加二百四十亿美元。

首战告捷后,黄士杰在论坛“弈棋”中以帐号aja发文,写道:“这次比赛我们使用的是分散式版的AlphaGo,并不是单机版。分散式版对单机版的AlphaGo胜率大约是百分之七十。”

“单机版”与“分散式版”的差别在于后者运用更多部电脑、计算能力更强。林顺喜表示,谷歌经过一千多台电脑对战测试得出分散式胜率可达百分之七十,但单机版胜率只有四成左右,因此用分散式版应战。

台湾棋院八段、冠军数全台第七的职业棋士林圣贤接受亚洲周刊采访表示:“电脑能打败人类高手,是因为电脑有办法搜集人下棋的资料库,但人无法判断电脑会到什么程度,像第一盘李世石就会去尝试他自己从来没下过的棋路,他以为电脑只是吸收资料库,根本不知如何应对,电脑在暗,人脑在明的时候,人脑要慢慢去尝试跟适应。”他质疑,李世石会不会有些心理压力而放不开?平常人跟人对弈的时候,会猜想对方要做什么,从他的表情可以看出局面好或不好,但面对电脑完全没有这些资讯可以做判断。

学习电脑思考方式

林圣贤表示,电脑厉害的地方是它运算能力非常快速,每个计算的结果,都可以知道最后会得出怎么样的答案,可能可以列表在旁边供参考,包括各式各样的变化图,但人脑的记忆库无法储存这么多记忆图,会导出怎么样结果,也只能大略估计,差别在这里。林圣贤表示,这次人机大战的意义在于大家可以换个角度想,“我们也学习电脑思考方式来下棋,可以下得更强、更完美”。

这位台湾围棋高手表示,围棋是一种比大小的游戏,所以每步棋的价值,无法用精准的数字判断出来,如果电脑在这方面非常强的时候,人就不容易下赢它。事实上,电脑有些部分是可以赢人脑的,包括有实质化数据,像大小的目数可以计算出来的。但比较抽象的东西,像轻重、厚薄、强弱等,人脑还是占有优势。

阿发狗不同于以往的人工智能。一般的程式很难自我训练,无法迅速累积功力,效率不高,可能训练一年,也升不到一级,以这种速度,可能要五十年才能演化成很厉害版本。政治大学心理系副教授杨立行表示,阿发狗采用类神经网路系统为棋局“样态辨识”(pattern recognition)的机制。类神经网路较传统AI更优秀的地方为,它能透过经验自我学习,不但记下曾看过的棋形,并训练修正,更从中归纳样态。

此外,阿发狗把既有的深度学习(Deep Learning)与蒙地卡罗树搜寻 (MCTS) 技术做了巧妙的结合。杨立行表示,蒙地卡罗树的作用是让AlphaGo能透过棋形样态做形势判断,并且估计能提升最后得胜机率的着手。

阿发狗的技术不断精进,去年十月在没有任何让子的情况下,以五比零完胜欧洲冠军、职业围棋二段樊麾。短短不到半年就挑战围棋九段的棋王,相当不可思议。林顺喜表示,电脑软体研发都是渐进式,今年打败二段,明年打三段、四段,可是阿发狗在极短期间就攻顶,“有史以来也只有阿发狗做到”。

阿发狗不断提升实力

“谷歌很厉害一点就在于它怎么能精确估算到阿发狗在半年内可以提升到围棋九段的水平?黄士杰可能起了重要的作用”。林顺喜表示,如果早一个月比赛,阿发狗可能只有八段棋力,能估到这么精准,必须靠围棋与写程式兼具的高手。“太早比赛可能会输,太晚比赛就可能漏失时机”,因为脸书也积极想要进军这个商机无限的领域。

林顺喜指出,人类智力已达极限,而阿发狗仍在极速发展之中,再过一个月,他相信阿发狗目前大约围棋九段的实力可以再度提升,到时候所有人类的围棋高手都不是它的对手。他说,阿发狗目前采行的这些人工智能训练模式,证明它有这样的机会,包括一直训练、自我对战的做法,这也是未来的趋势,智能体系可以循这样的学习模式,越变越强。

简单说,这种训练的精髓就是“汰弱留强”。林顺喜说,这组参数组合跟另一组参数组合看谁赢率高,赢率高的版本留下,硬体也一样,“分散式”版本,现在用一千多台机器,就有七成胜率,假设谷歌又投入一万台机器,这个版本的胜率可能到九成,因为谷歌的硬体技术全球无人能敌,它启动几万台机器也非难事,如果继续发展下去,一如西洋棋电脑程式,人类任何人都非其对手。

林顺喜表示,阿发狗打败韩国棋王所代表的意义,跟当年“深蓝”战胜西洋棋世界冠军不太一样,“深蓝”的程式是固定的,“只能下西洋棋,不能做别的事”,IBM也未将“深蓝”技术应用在其他领域,但这次人工智慧很多技术全部都整合在阿发狗,让它可以不断学习、训练、对战,“就算没有比赛,阿发狗仍不断在训练,找出更好的参数组合,它的棋力每经过一天都会有所长进”。他说,一般认为阿发狗第二场下得比第一场更加完美,比人犯的错更少,走了很多奇妙的招数,便是它不断在训练、增进棋力的证明。

阿发狗三连胜后输给李世石,说明这个集众多程式与围棋高手的智慧结晶,并非无懈可击。

DeepMind公司执行长哈萨比斯(Demis Hassabis)十三日表示,“阿发狗原本下得不错,但后来因为李世石下得太好,它遭到压力后犯了些错误”。他形容这次失利“很有价值”,将有助解决这个超级电脑的问题。

据李世石表示,阿发狗的弱点包括难以因应对手使出某些意外招数,导致更多失误。

阿发狗仍有弱点

林顺喜表示,现阶段阿发狗当然还有很多弱点,毕竟它是从二段慢慢训练,到今年三月提升到大约围棋九段,以其实力,估计可以名列全球围棋高手的前五名(据世界职业围棋排名网站GoRatings.org,阿发狗目前排名窜升至第二名,仅次于中国棋王柯洁),但打败李世石,不意味它是世界第一,这还牵涉到高手下棋时的精神状态,还有运气,如果他失误很少,就会打败阿发狗。

这次败给阿发狗的李世石,今年三十三岁,棋风凶悍,能攻擅守,刚柔并济,成为棋界巨匠。他与十九岁的中国棋王柯洁,为当今围棋界一时瑜亮,柯近况佳,去年夺得三个世界冠军,上月才在央视“贺岁杯”围棋赛中击败李世石,对战成绩以八比二领先。

但阿发狗没有挑战目前世界排名第一的柯洁,而是世界排名第五的李世石,据林顺喜表示,李世石拥有这个世纪最多世界冠军头衔,代表当今围棋最高水平,所以成为第一邀请对象,柯洁列第二优先,“李世石接到邀请函时,思考五分钟就答应了”。

瞄准通用型人工智能

林顺喜表示,阿发狗不只会下围棋,这次的做法称之为“通用型人工智慧”,这样的模型一旦建立起来,未来可以举一反三,运用到各个领域,谷歌想要应用在全面性智能相关产业的企图相当明显,经过这次阿发狗的突出表现后,各国势必争相投入人工智能领域,毕竟机器智能化已是不得不然的趋势。

未来人工智能势将逐渐取代人类,人类总是要适应文明的演化,要如何利用智能型机器,将是未来的重要课题,有可能像电影的情节,机器可能是另外一个独立的个体来帮助人类,或者人类可能有一天在脑中植入晶片,帮人做决策,人就更厉害,但却违背人类原来的本质。学者指出,如果机器以后在每个领域都赢过人类,相关的应用必然会发明出来,接下来人类怎么办?是乖乖地使用它?还是人有可能演化成比机器更厉害的物种?

进入新人类文明

阿发狗超人类表现掀起各界对未来世界的热烈讨论。施振荣指出,未来的世界关键不在电脑超越人脑,而是人脑将结合人工智能(虚拟机器人),人脑要学习如何驾驭机器人,结合成一体,协同进入新人类文明。

阿发狗尽管很会下棋,可以轻松在大部分棋局打败人类,但它无法感受到喜悦和满足,甚至也不会闻味道,包括人文艺术、美与善的感知能力、宗教信仰的渴慕,以及语言的幽默和深意等等,可以说,电脑对此都一窍不通,甚至无法跟一个婴儿相比。于是,对人文素养的栽培就更显重要,当人类不再一味地追求舒服和便利,而是反身探求己身的心情和精神,随着科技日益革新,文理两面的层次也能均衡提升。但如果机器人可以有感受与人文素养时,它是否会成为一个更完美的人?人类创造“超人”的科技胜利,是否也蕴含人类面对被“超人”奴役的悲惨命运?■

来源:《亚洲周刊》(2016年3月27日第30卷 12期)
作者:童清峰

You may also like...