148
周泽雄

一
谷歌旗下的决战DeepMind团队向智力游戏之王围棋发起挑战时 ,除了东亚三国——中国 、天天日本和韩国,决战全世界人民还是天天乐观其成的 。在缺乏围棋传承和情感寄托的决战国家,围棋之高深莫测只是天天租服务器一个月多少钱一个传说 ,一座人类智力的决战标杆。一旦DeepMind团队设计的天天人工智能程序AlphaGo击败当代围棋的顶尖代表李世石九段,那意味着竖起了一座新的决战智力标杆,不待谷歌公司昭告 ,天天人类都会意识到 :人工智能已经进入了一个全新领域。决战可以想见 ,天天接下来计算机科学界和企业界将有大量活计要做 ,决战未来世界也将随之面貌一新。天天
围棋之无边深奥和无穷计算,决战曾被视为计算机难以攻克的最后一座人类智慧堡垒 。AlphaGo出现之前 ,稳健的估计是,围棋至少还能在人工智能面前抵抗十年,这是由一系列人机比赛和统计数据支持的结论 。仅在半年前 ,最好的围棋程序面对职业棋手还得受让五到六子,差距明显 。关于围棋复杂性的各种数学描述,同样可以维持围棋智力金字塔顶的荣耀 。围棋理论上的变化量 ,相当于10的170次方,以暴力穷举著称的计算机,之前无能为力,而国际象棋、中国象棋等变化量较小的技艺 ,十几年前即在暴力穷举的计算机程序面前俯首称臣。
今日计算机技术与 1997年IBM“深蓝”战胜国际象棋冠军卡斯帕罗夫的时期相比,早已不可同日而语,尽管如此,与人类代表李世石九段正面对抗的那台分布式版AlphaGo(比单机版更厉害),据说仍动用了上万台机器(对外宣称1200个CPU,2000个GPU),比“深蓝”的计算力提高了三万倍 。更直观的说法是:比赛期间这些机器仅每天开销的电费,即达3000美元——一个何其霸道的机器狂魔 !想象一下,相当于一支由三艘核动力航空母舰组成的航母编队 ,与一艘小舢板进行正面决战 。使对抗成为可能的,是小舢板上那颗不可估量的人类大脑。
围棋的国内永久免费云服务器超级复杂,源于它规则上的超级简单:每一颗黑白子绝对平等,不存在象棋游戏里的等级差,它是一个意在开疆拓土的帝国游戏,而非专注头衔大小的君主游戏 。落在棋盘上的每一枚子 ,长远看都包孕着无穷变量,此时此地价值连城的“棋筋” ,寥寥数手后也可能沦为精华已尽 、可舍可弃的鸡肋;甚至 ,分明功能丧尽的一堆死子 ,在棋局的某些阶段还可能扮演卧底 ,担任绝地反击、收复失地的先锋:李世石先生赖以成名的绝技“僵尸流” ,即是此类场景的形象描述。
围棋虽是胜负世界,但在不少场合——尤其序盘阶段——落在棋盘上的黑白子未必具有非此不可的必然性 ,它还可能代表了棋手的趣向、风格和心情 ,无法从功利的胜负角度加以评估 。另外,围棋世界的开放性和无限可能性 ,使它具有纵容天才、善待直觉、怂恿想象的特质,来自大棋士的“神之一手” ,常常视对方老谋深算的海量推演为无物,直接扭转了局势,摘走了胜利 。李世石与AlphaGo的第四局进行至78手,人类天才即以一招妖魅不可方物的凌空一挖 ,瞬间让那台之前做足大棋士模样的超级计算机 ,现出智力原型。
就此而言,职业棋手小觑计算机程序,不见得是一种盲目自负。他们——个别先锋人士除外——只是不知道拥有新颖算法的人工智能目前已发展到何种阶段,他们坚信计算机不可能拥有人类直觉(这是对的),但不知道计算机可以假装拥有人类直觉,且足以乱真。后者即所谓图灵测试,意即:如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误以为对方是人类,则测试通过 。实际上 ,Al-phaGo在与李世石五番棋较量的第一盘获胜后 ,网友中流传的抖音云一个搞笑段子 ,即说明了AlphaGo通过测试 :网友猜测 ,对李世石近年胜率最高的中国等级分第一人柯洁九段(两人正式交战成绩为柯洁8:2领先 ,且输掉的两盘都在番棋中,不影响最终胜利),藏在DeepMind团队的机器里。
三个月前,DeepMind团队通过发表在顶尖科学刊物《自然》上的论文正式宣布 ,一台名叫AlphaGo的人工智能围棋程序以5:0的悬殊比分战胜欧洲围棋冠军樊麾二段 ,整个棋界惊掉了下巴 。他们意识到,狼终于来了。随后,DeepMind团队宣布,2016年3月9日,AlphaGo将向近十年来围棋世界最优秀的代表、手握14个世界冠军的韩国大棋士李世石九段进行五番棋挑战,胜者通吃 ,将独揽100万美元奖金。
二
如果把AlphaGo向李世石九段下的战书视为一种好莱坞式的外星人入侵警告,把以李世石为代表的职业棋界视为人类最可信赖和依靠的抵抗力量,类似《复仇者联盟》里的“钢铁侠”和“美国队长”,我不得不说 ,棋界精英在此危机时刻向民众作出的许诺,是极度鲁莽轻率的 。假定我们乃是需要他们保护的地球公民 ,我们等来的已经是一个悲剧。
下转 34版
上接 33版
一开始是信誓旦旦的拍胸脯 ,李世石先生率先宣布 ,必须五比零获胜 ,输一盘都是失败。他的声音并不孤单,几乎所有职业棋手都站在他一边,口气也并不稍逊。虽然 ,来自计算机科学家的声音也渐有耳闻,其中最刺激的一个是 :DeepMind团队通过内部测试,判定李世石毫无机会 ,将0 :5落败。但这个声音没有得到职业围棋界的正视,他们似乎依旧沉迷于用决心代替思考,用情感代替理智,用过往代替现在 ,用立场代替决策。
李世石的第一盘失败了 ,计算机展示了出乎人类棋手理解之外的手段(棋手戏称为“AlphaGo流”或“机器流”) ,还用一手犀利无比的云服务器便宜的打入 ,瞬间抹去李世石的大块实地。虽然柯洁九段预测到了这手打入,但包括李世石在内的大量棋手 ,显然没有料到。职业棋界惊愕莫名 ,这是历史性的一天,棋手集体失眠。
第二局李世石又输了 ,人类棋手未出现明显错招 ,局面一度还相持不下,但AlphaGo显出高人一等的收束功夫,稳稳扩大战果。这时出现了一个有趣情况:无论AlphaGo下出何等怪异的招法(比如那手在任何围棋宝典里都不存在的五路肩冲),职业棋手已不敢轻斥其非。他们开始诧异AlphaGo充满机油味的全局眼光和悠远算路,尝试体会另一种围棋思维的存在。柯洁九段为了向AlphaGo致敬 ,在担任解说嘉宾时特地穿上一身只在正式比赛时才穿的正装。
第三局,AlphaGo以无可争议的压迫式手段,对李世石通盘吊打。围棋的最高级别是职业九段,李世石的中盘战斗力曾被其韩国同行夸誉为“十三段” ,而AlphaGo似乎拥有十五段的棋力,以张弛有度的太极绵掌功夫 ,迫使人类棋手束手无策。李世石黑棋第15手 ,顶多只是出击过早、用力过猛 ,远远谈不上恶手或败招,然此手过后 ,人类代表竟无可挽回地走向了不归路 。(声明一下 ,我不认为我对围棋的微末理解,有资格让读者分享,本文中关于具体着手的看法,均来自职业棋手的意见 。在五盘棋比赛过程中 ,我一直在多个视频网站听柯洁 、古力 、陈耀烨等中国顶尖高手作现场讲解。“十五段”的说法即得自棋圣聂卫平九段的即兴观感,而“吊打”一说来自世界冠军唐韦星九段的评价。)
总之,三局过后,棋界黯然神伤,购买云服务器一片肃穆 ,聂卫平表示“要向阿尔法狗脱帽致敬”,古力九段承认从“机器流”里学了几手,韩国围棋王子金志锡九段竟气馁到认为AlphaGo可以让自己两子。之前一直坚信能够战胜AlphaGo的柯洁九段(他是当今棋界最有资格说这句话的棋手) ,也默默调低了自己的胜率 ,而他当晚通过微博向AlphaGo发出的挑战 ,明显带点悲壮色彩:“来吧!管你是阿法狗还是阿法猫!我柯洁在棋上什么大风大浪没见过?让风暴再来的猛烈点吧 !”
第四盘棋,怎么说呢,在李世石走出疑似棋神附体的78手挖之前,形势已非。那手挖固然奇妙 ,本身却不具有转败为胜之力,而更像是诱导犯错的一手 。陈耀烨九段认为 ,假如AlphaGo的79手应在天元的左一路,李世石未必有后续手段 ,柯洁也认为这手棋“并不是稳稳成立的”。谁知比赛转眼进入戏剧化阶段 ,机器出现异常 ,接连走出不可思议的棋:先是连走死棋(意味着帮助对手扩大并巩固阵地),继而又在李世石的白角里无端送吃一子 。虽然了不起的柯洁九段90手后即勇气十足地宣布“阿尔法狗没法下了”,但另一些职业棋手仍惴惴不安 ,俨然拥有未来世界“原力”的AlphaGo ,使这些训练有素的棋手暂时失去了判断力 ,他们担心机器人正在酝酿一个全歼中央白棋的超级计划 。万幸,AlphaGo昏手不断,艰辛备尝的李世石终于赢回一局,职业棋界欢欣鼓舞,当晚的李世石成了韩国人的民族英雄,地球人的蜘蛛侠 。尽管,稍稍冷静下来,谁都会意识到机器只是出了一个bug ,而bug总是可以修复的,何况AlphaGo还具有自我学习和自我提高的殊能。
第五局,人类棋手调整心态 ,打算不计成败利钝地再与AlphaGo切磋一盘。序盘阶段 ,在棋盘右下角,云服务器低价在计算机最令人畏惧的局部对杀领域,李世石先生无所畏惧地直面挑战,以精准强悍的人类计算力 ,大有斩获,迫使AlphaGo丢盔弃甲(损失至少10目实地),另辟第二战场。接着 ,说不清李世石在哪儿出了问题(职业棋手颇多分歧),AlphaGo施施然使出重整河山的魔力,转眼间已令棋盘非复旧观。100手过后 ,本次比赛从未预报有误的柯洁九段宣布人类棋手已经无望 。
最终比分定格在4:1。DeepMind团队漏算了AlphaGo在第四盘中那个不可理喻的bug ,才使人类棋手拣回一盘 。五盘过后,中国德高望重的棋圣聂卫平慨然长叹:“AlphaGo不是厉害,而是太厉害 。”他虽然承认李世石本次比赛发挥不佳,但他同时强调,换别人上场 ,结果也一样 。有趣的是 ,AlphaGo不时还会犯些低级错误(比如尽量回避打劫 、不懂得保留变化等等),但其综合棋力 ,仍在人类顶尖棋手之上。假以时日,必将一骑绝尘 ,令人类棋手望尘莫及。
我钦佩聂棋圣勇于自我纠错的胸怀,因为比赛开始之前,他曾断言AlphaGo毫无机会,李世石将百分之百获得胜利 。韩国棋院则在比赛结束后,授予AlphaGo名誉九段 。
三
在AlphaGo决战李世石之际,职业棋手说得最多的一句话是,必须捍卫职业棋手的尊严 。
何谓尊严?尽人事,知天命,存理想,尊严自在其中。归根结底 ,人只能追求属于人的尊严。我们理应排除低于人性的1元一月云服务器目标 ,但也不必以神祇自居。
道理原本平凡,没有人会因为奔跑不如猎豹 、计算不及一台小型计算器就灰心丧气,人类的天赋理性会告诉每一个人 ,为这等事发愁 ,纯属庸人自扰 。如果有人发问:你们是否想说,那些早已被电脑软件击败的中国象棋和国际象棋选手 ,都已失去了尊严?我相信职业棋手都会坚决否认:我们不是这个意思。——他们的确“不是这个意思” ,但又的确误解了“尊严”。即使从他们深爱的围棋角度来看,他们的担忧亦属多虑。附带一说 ,电脑软件在象棋领域的地位已经达到这种程度:比赛期间,主办方必须防止选手中途使用手机或接触互联网,否则,棋手可能借如厕之机从手机软件里求得脱困仙方。随着Al-phaGo发威 ,棋手发现,围棋赛场距这一步也已不远 。
已故日本名誉棋圣、曾以“前五十手独步天下”闻名的藤泽秀行九段说过一句名言 :“棋道一百 ,我仅知六七。”超级大棋士吴清源也认为 :“与棋神下,我坚持不到50手 。”说法是否夸张 ,无人知晓。但所有职业棋手的内心都有一位围棋之神(你也可以叫他“围棋上帝”),他们不知道自己距这名假想中全知全能的上帝到底有多远——换用棋手术语 ,就是不知道围棋之神可以让自己几个子 。若尊重藤泽先生提供的比例,再结合棋力最高者拥有的等级是职业九段,我们不妨说 ,假想中的围棋上帝或有九十九段的棋力。
其实 ,每位棋手都承认,围棋的深奥性不可穷尽 。于是,就出现了两种尊严 :一种是关于谁更应该拥有围棋的最终解释权 ,是人还是机器?另一种则纯然站在围棋技艺角度 ,将最高的荣耀给予那位在实战中拥有更高胜率的对象,不管该对象是人还是机器。若站在后者角度 ,前一种尊严更像是云服务器租用平台一种虚荣 。所谓虚荣,就是那种即使名不符实也要拼死捍卫的东西,而尊严则必须处在恰如其分的位置上。
围棋世界是胜负世界,顶尖棋手常被称为“胜负师” ,但围棋作为智力圣杯的精髓,源于对围棋真理——棋道——的追求,真诚的“求道派”才是胜负师的后盾和基座,拒绝让亢奋的胜负心扰乱平静的求道立场的人,才真正代表并捍卫了围棋的尊严 。
比如 ,当年明知中日两国处于敌对状态 ,仍执意将中国围棋神童吴清源带到日本并善加珍护 、培养的濑越宪作先生等日本友人,就是围棋求道派的突出代表 。即使吴清源不久后将整个日本棋界精英打趴在地 ,岛国上的军国主义者和民族主义者又在大肆反对 ,他们仍不改初衷。其实,吴清源先生的超凡棋力之于当年日本棋界 ,颇类似于今日之AlphaGo ,但真诚的求道派除了仰慕心中的围棋之神,无视任何世俗势力 。
再如第四盘获胜的李世石先生,他明知胜利带有侥幸成分,明知在现行贴目规则下执白棋相对更有利(他本人执白棋的胜率也更高) ,但为了探索AlphaGo化为高人般的幽邃手段 ,他向DeepMind团队的领军者戴密斯·哈萨比斯先生提议,要求第五盘执黑 。职业棋手发现,尽管李世石迫切渴望再得一胜(除了名誉 ,胜利还能带给他两万美元的获胜奖金),但他并未下出意在诱使AlphaGo再度犯浑的超常规手段,行棋堂堂正正 ,他宁可心悦诚服地拥抱失败,也拒绝廉价的胜利。与旁观者想当然的揣测正好相反,饱尝失败的李世石先生,对局过程中始终心怀喜悦,他告诉记者:“这次比赛我就得到了快乐 。关于对棋的理解,我感到了人的创意的局限性。看到AlphaGo的招法,我会想,以前对棋的理解是否是对的呢?”
这才是真正属于围棋和围棋人的高贵,真正的香港服务器一流棋手 ,或多或少都有这份高贵,不如此他们无法达成棋界成就。在人间棋手的长廊里,为棋道呕心沥血的故事不胜枚举,它们每一个都神奇得像传说,优美得像童话。它们都是真实发生过的。
四
笔者的生活和文字工作,与围棋毫无关联,但职业棋手一直是我最偏爱、最尊重的一个群体 。真正的棋手都是谦虚本分的 ,甚至连经常被误以为有点轻狂的李世石和中国十九岁天才柯洁也是如此。这不是那种社交礼仪场合下的谦虚,而是来自围棋本身的馈赠。围棋无可比拟的奇妙性,容不得轻狂者立足 。所以,棋手最常说的一句话是“我看不清楚”。
虽然职业棋手在领教AlphaGo之前的表述有点丢人,但在获悉Al-phaGo实力之后 ,他们的表现又是诚挚感人的 。这不是一群固执己见 、固步自封的人,他们迅速意识到 ,Alpha-Go的下法将拓宽围棋的未知领域,使得人类有望进一步接近真实的围棋之神。
AlphaGo的现有实力,是在输入海量棋谱的基础上,再结合AlphaGo独具的自我对弈功能,扎扎实实获得的。当然 ,我们这些外行还听说了“蒙特卡洛树搜索” 、“神经网络” 、“价值网络”等计算机术语 ,正是这些计算机人工智能领域的新奇突破 ,使Al-phaGo如虎添翼。但是,尽管AlphaGo拥有“深度学习”的技能,该深度与擅长“举一反三”“闻一知十”的人类相比 ,不是一个概念,其学习方式似乎仍然处于“不行千里 ,无以致跬步”的阶段 。相比AlphaGo的饕餮胃口,人类有记录在案的职业棋手棋谱,尚不能满足它的便宜的香港云服务器学习需要 ,AlphaGo成长过程中,杂乱无章地吞食了大量来自网络的业余棋手对局