html模版擁抱戰敗:圍棋國手與來勢洶洶的人工智能




柯潔



AI會搶走我們的工作?還是重新定義瞭工作?甚至會為人類創造更多更好的工作?它們是設備?是朋友?抑或是人類的掘墓人?每一個議題都是一盤未下電動床完的棋。被AI率先入侵的棋類運動,很自然地被人們當作一個眺望未來的參照。



中國圍棋隊領隊華學明的窗戶,正好對著國傢體育總局運動員公寓的班車停靠點。來自全國能跑會蹦的頂尖選手每天會在那裡上車,前往位於天壇東門體育館路的訓練局大院兒——在那裡,每個項目都擁有一個獨立的訓練館。這些代表著這個國傢最高競技水準的人在各個場館裡揮拍、擊水、騰挪跳躍,與隔網而立的對手,或是教練手中的秒表一爭高下。



相比之下,圍棋訓練所占用的場地要經濟得多。訓練室就設在中國棋院辦公樓的三層,走廊裡掛著描繪對弈意蘊的名傢書畫。隊員們——他們更多地被稱為“棋手”——就住在樓上,隻需用纖長的手指摁下電梯,就能從宿舍到達“訓練場”。



棋牌類項目是否可以被稱為競技運動,始終有人存疑,但這幾間訓練室的棋手們卻和等班車的健將們一樣,憑著過人天賦、極限訓練擠進金字塔尖。中國圍棋隊總教練俞斌將競技圍棋定義為“充分競爭項目”,“現在一個孩子12歲以前就完成瞭過去專業棋手20歲時才能達到的訓練量,15歲到18歲就非常厲害瞭,可以拿世界冠軍。”



柯潔是這句話最好的註解,他7歲學棋,到手握第一個世界冠軍隻用瞭11年,18歲時成為史上最年輕的三冠王,不到20歲已經斬獲四個世界冠軍頭銜。



柯潔 圖/劉昊



3月18日,一個周六,在領隊華學明的安排下,柯潔在小對弈室裡接受我的采訪,門口一幅字寫著“揮運之妙,必由神悟”。整個三層都非常安靜,隻有兩個棋手在旁邊大訓練室裡擺棋。



“悟是非常重要的,勤奮、天賦什麼的,這裡都是不用提的,這是最基本的,不然你不可能到這兒來下棋,”他的手指修長,不拿棋子也習慣在面前的棋盤上指點示意,“我參加瞭三次選拔,才進入國傢隊,那個時候古力、李昌鎬都是我想要超越的……從來沒想到,自己一生最大的對手竟然會是電腦。”



3月停暖之後,北京氣溫忽高忽低,柯潔與AlphaGo對決的消息也遲遲未定。4月10日,確切消息終於與穩定氣溫一同來到——三番棋對決將於5月在烏鎮進行,除瞭柯潔單挑,還有PairGo——AlphaGo作為隊友加入古力與連笑的對陣;Team Go——五位圍棋國手組團對陣AlphaGo。一部關於AlphaGo的紀錄片也定於4月21日在紐約翠貝卡電影節首映。



驕傲



程序員們一早就把棋盤當作瞭試驗田,用以檢驗和發展計算機的計算和搜索能力。他們在20年前攻克瞭國際象棋,十年前拿下瞭中國象棋,之後便踟躕於圍棋的361個交叉點上。



圍棋行棋規則簡單,然而在19 19的棋盤上卻生出巨大的復雜性,棋手們最愛說“千古無同局”,一局150回合的對弈,其中的變化就超過瞭宇宙的原子總數。



“應氏杯”世界圍棋大賽創辦人應昌期先生曾在1986年懸賞4000萬臺幣,獎勵可以戰勝人類頂尖高手的程序員,有效期至2000年。這筆獎金最終沒能發出去。



2007年,日本電氣通信大學創辦首屆UEC杯電腦圍棋大會,但在那些年,沒人記住獲勝軟件的名字,它們全都停留在業餘水平。直到借助蒙特卡洛算法,日本圍棋軟件ZEN終於取得瞭突破性成果——2012年,ZEN受讓四子,擊敗瞭武宮正樹九段。從2013年開始,日本棋院推出職業棋手與UEC杯優勝者之間的“電聖戰”,與其說是比賽,更像是職業棋手給電腦下指導棋,電腦受讓四子幾乎成瞭大賽傳統。那會兒,棋界和計算機界專傢普遍認為,十年內圍棋軟件尚無法突破人類水平。



“第三次浪潮”持續拍打著圍棋堡壘,但因為計算精度和深度不足,無法對職業棋手構成真正威脅,這個古老的遊戲被程序員稱為“人類智力的聖杯”,而超一流棋手則是驕傲的“聖杯守護者”。



“我非常喜歡勝負師這個稱謂,圍棋就是我的全部,是我最擅長做的事情,所有的付出最大的回報就是勝利,我每天都通過實戰去體悟,想要更多地掌握制勝要訣。”柯潔說他一度自認為至少掌握瞭圍棋之道的“百分之五十”。2016年3月李世石對陣谷歌人工智能(Artificial Intelligence)圍棋軟件AlphaGo前,柯潔剛剛在夢百合杯世界圍棋公開賽決賽中擊敗瞭他,“我這麼年輕,當然希望自己一直贏下去,一直驕傲下去,統治棋盤多少多少年……”



李世石在五番棋戰中以1比4輸給AlphaGo,彼時,業界普遍認為李世石輸在輕敵及對圍棋AI棋路的預備不足上,柯潔也因一句“阿爾法狗贏得瞭李世石,贏不瞭我”爆紅。



2016年3月,AlphaGo以4比1擊敗李世石九段



夢百合杯決賽前,有記者問柯潔,說李世石自認為決賽有五成勝率,“如果機會是100的話,我想他是有5成。傳奇該謝幕瞭!”18歲少年的話被視為對前輩的不恭。



“我當時所有的註意力都在贏棋上,我並沒有刻意想要激怒誰,每個棋手心裡都想要贏,表達方式上不一樣而已。”柯潔說,自己的張揚有些時候甚至是刻意的,“傳統行業都不太景氣,我們有的比賽,恨不得十年前怎麼辦,現在還是怎麼辦,獎金十年能漲個兩萬就不錯瞭,房價漲瞭十倍不止。必須想辦法讓更多人關註我們這個傳統項目,都那麼四平八穩,誰看?”



“贏”是吸引觀眾的首要砝碼,被AI狙擊之後,棋界內外都有人出來打圓場,主張職業棋手淡看勝負,稱即便有一天無法與人工智能在棋盤上爭勝,圍棋文化的博大精深卻不會因此受到影響,反而會借助技術發揚光大。



“將來的事情怎麼樣,我說瞭不算,下不贏AI,是不是我們的聯賽就沒有人看瞭,贊助商就不願意冠名瞭,這不由我管,”總教練俞斌立定勝負根基,半步不讓,“圍棋的美我覺得就在於勝負競技,我們說這一招很美,是因為它導向瞭勝利。”他辦公室門口的一幅字講的是琴棋書畫各有其妙,他卻是斬釘截鐵:“古代中國人以琴棋書畫陶冶情操,我覺得下棋對品格的塑造恰恰是通過勝負。”



“一盤棋誰都能輸,我們職業棋手的使命就是去贏,”柯潔聽說俞斌教練把一盤棋比作一個手工藝人傾註心血的藝術品,呵呵一笑,“我說個俗點兒的,這麼說吧,贏一盤棋一萬塊錢,輸瞭一分沒有,你肯定是想贏的對吧?因為這是你的工作、你的飯碗。我們棋手跟公司上班的人一樣,你去跟人吃飯、談合同,費瞭很大的勁兒,最後談崩瞭,你說心裡難受不難受。”



“棋手輸棋的那個晚上是很難熬的,”俞斌說,“我剛做總教練時壓力特別大,隊員一輸,各種壓力都來瞭,但是那種壓力也比不瞭自己下棋時輸棋的那種難過……”



頂尖職業棋手之間一般互有勝負,當看到近十年來獲得世界冠軍最多(14個)的超一流棋手李世石被阿爾法狗壓制,他們自然感到震驚和壓抑。當時放狠話說能戰勝阿爾法狗的不止柯潔一個,羅洗河九段甚至還說自己能讓阿爾法狗四子,後來改口說,“四個子讓不動,兩個沒問題。”



“我們知道有一天計算機會向我們職業棋手發起挑戰,但沒想到這一天來得這麼快,”古力說。他的微博認證是“圍棋世界冠軍八冠王”,是中國隊裡贏得世界冠軍最多的。這位33歲的“老棋手”穿著一身運動服接受采訪,“一會兒我要去踢球”,年輕時他曾因踢球受傷而坐著輪椅參加圍甲聯賽,這個愛好至今未改。當年的“性格棋手”,已經隨著年齡的增長,變得極為謙和。



古力 圖/劉昊



他與李世石被視為“一生的對手”,2014年,兩人曾下過十番棋,李世石以6比2的大比分提前終止瞭比賽。李世石輸給計算機後備受非議,古力堅決站在老對手這邊,力挺人類棋手——與“人機大戰”一樣,這也是這一年來開始出現的熱詞。



“每一次與李世石對陣都是我寶貴的財富,他總能在別人想不到的地方落子。之前我的確覺得計算機是不太可能贏李世石的,看到下成3:0後,我沉默瞭很久……就覺得內心比較沉重啊。第四局李世石贏瞭回來,感覺作為人類棋手,我們又燃起瞭一些信心。”



羅洗河則在2016年10月加盟騰訊人工智能實驗室,參與國產圍棋AI研發,團隊負責人說他們想要把這個圍棋AI視為自己的一個小孩子,“慢慢養大。”羅洗河說,“我不是這麼想的,我來,是參與‘造神’的。”



謙卑



Go是日語“圍棋”的音譯,AlphaGo原本有自稱“圍棋上帝”的雄心——《聖經》啟示錄裡上帝說“我是Alpha,我是Omega(分別是希臘字母的首末兩個字母,意為上帝決定世界的起始)”——不料被人類吃瓜群眾戲謔地翻譯成瞭“阿爾法狗”。



2016年歲末至2017年年初,升級版AlphaGo在奕城和野狐兩大圍棋網站踢館,60場網上快棋公測通殺中日韓頂尖職業高手,把它的新名字Master(大師)刻在瞭60連勝的記分牌上。



Master 的連勝無法阻擋時,古力在微博上宣佈騰訊野狐將出資十萬元,懸賞狙擊。



“60盤棋!局面照說會有很多種變化,我原來覺得作為一個人工智能,或者是作為一個機器來說,它應該總會有一些缺陷,但至少從這次看,我們的壓力還沒有足以讓它顯示出它的缺點。”與Master對陣那些日子,古力每天在微博上為人類棋手加油,然而職業高手輪番入場,結局卻隻有一個——“抬走,下一個!”



“這才是人類棋手最絕望的時候。”他說。



柯潔與Master交手後,提及此前的豪言,也會特別備註,“我當時說的是能贏與李世石對弈的那個版本。”



連勝之後的Master拒絕瞭第十屆UEC杯的邀約,退隱江湖。就在柯潔接受采訪的第二天,由羅洗河擔任陪練的國產AI“絕藝”在日本拿下UEC杯冠軍。3月26日,“絕藝”又毫無懸念地在第五屆電聖戰中擊敗日本新銳棋手一力遼七段。



在騰訊野狐上,絕藝每天都與中日韓最強棋手對局,如果說阿爾法狗從天而降,絕藝就是在他們眼皮底下長成的。



絕藝用的正是AlphaGo“深度學習”算法,開發它的程序員們把谷歌DeepMind實驗室2016年1月發表在《自然》雜志上的那篇論文“讀瞭至少一百遍”,用三個月的時間完成瞭這個國產圍棋AI神經網絡的搭建。



谷歌DeepMind創始人、AlphaGo之父戴密斯 哈薩比斯



正是這個神經網絡,把人類的直覺賦予瞭計算機,大大提升瞭電腦計算的深度和精度——論文顯示AlphaGo輸入瞭16萬盤人類棋手的棋譜,學習瞭人類落子佈局的特征後,它又自我對弈3000萬盤,不斷提高神經網絡的精度。



那篇論文發表時,AlphaGo已經戰勝瞭歐洲冠軍樊麾二段,華學明說,當時自己是有些預感的,“能夠戰勝職業棋手,這說明計算機圍棋已經取得瞭實質性突破,一旦突破,問題都會迎刃而解,進步會非常快。”



的確是快得非常——2015年10月五勝樊麾二段,次年3月,AlphaGo已經從V13進化到V18,長瞭四個子的棋力,4比1擊敗李世石九段的正是這個晉級版本。



“在AI出現之前,職業高手普遍認為,即便是‘圍棋上帝’,也隻能讓自己兩到三個子。”李喆六段說,水平越高提升越難。他曾在14歲打入世界圍棋大賽本賽,創下中國圍棋隊的紀錄,他告訴我,初學時職業高手能讓他25子,一年之後他便進步到隻受讓四子,“可是從四子進步到兩子,我用瞭兩年;從兩子進步到自己成為職業高手,大概又用瞭四年。”



“跟AI相比,人類棋手的進步簡直就像蝸牛一樣,”柯潔曾經一年之內把等級分排名拉升50名,他在接受央視董卿訪問時說,自己把所有時間都花在瞭棋上,“有時候累得啃個蘋果,啃著啃著就睡著瞭……”



絕藝“半歲”時就對陣聶衛平之子孔令文九段,當時它還叫“野狐掃地僧”,連勝八局,一夜成名。2016年11月19日,絕藝首次戰勝世界排名第一的柯潔。



幾個根本不懂圍棋的程序員,抱著一本《兒童圍棋課堂初級版》入門,最初連輸贏都看不明白,不到一年,居然做成一個超級圍棋AI——絕藝在野狐上對中日韓一流棋手保持百分九十以上的勝率,這個勝率目前隻有柯潔具備——古力對此甚感驚嘆,“我對科技產生瞭一種敬畏感,僅次於對大自然的敬畏。”



柯潔卻漸漸記不得自己是第幾次輸給AI瞭,“AI出現之後,我發現自己對圍棋的認識可能百分之一都不到。”



仿佛是對俞斌教練勝負觀的備註——“圍棋陶冶情操正是通過勝負”——在AI帶來的深刻挫敗中,柯潔和古力都有一種生命被失敗雕刻的感覺。



“AI沖擊以後,很多事情就感覺看得都特別的開,唉,輸就輸吧,我隻要盡力過,”柯潔的微博粉絲超過三百萬,在隊裡被戲稱為“網紅”,他也經常拿“現役棋手,過氣網紅”自我調侃,以前他很喜歡在微博上發美食拉仇恨,還拍過一個用圍棋“征子”手段擺出心形的小視頻發給粉絲當福利。



最近他有些意興闌珊,說連微博都不想發瞭,“現在心情不會有太大的波動,因為太大的波動對你沒有什麼好處,盡量讓自己心態平和,我現在越來越接近那個……中庸之道。”



絕藝在野狐拿到10D一個月後,柯潔也以對金帽子(世界冠軍)和銀帽子(全國冠軍)百分之九十的勝率升為10D。那天恰好是3月15日,人類超一流棋手驗證瞭自己的成色。古力特別在自己的微博上道賀,柯潔照樣一字不發,“我挺感謝古哥認可我,可是這個我也覺得沒什麼意思,隻是網站的一個噱頭罷瞭,我們圍棋哪有十段?”



“黑暗是你的朋友,絕望是你的領路人,”古力曾把這句話抄在本子上,“特別能體現我們棋手的心境。”他說自己記得最清楚的都是輸棋,但那些“輸瞭跟誰都不想說話的”黑暗經歷都無法與AI帶來的絕望相比。“沒太多跟大傢深談,未來出現瞭不確定性,茫然肯定是都有一點的。”



“AI肯定會越來越厲害,將來人肯定下不過它們。但是這就像人終究是要死的,難道你今天就去尋死,就不活瞭嗎?”華學明語速很快,她擊敗過日本超一流棋手大竹英雄,從事管理工作後,自言“離技術越來越遠”,年齡和經歷給瞭她從勝負之外審視圍棋的維度,“這個階段對棋手是非常痛苦的,尤其是完全沉浸在勝負中的年輕棋手,圍棋就是他們的生命。其實你往前走,圍棋是我們認識世界的一個窗口,不同的生命階段它都能帶給我們不同的理解。”



華學明說自己從圍棋中學到的一大智慧正是中庸,“年輕時覺得這個詞好像都不是一個好詞兒,慢慢才體會到這裡面的深意。”古力十番棋不敵李世石,她給古力發瞭一條短信說,“人生中的很多事,對於生命來說,都是多餘的,一切都可以從頭開始,所以不要計較太多東西。”



相持



人生失意無南北,日本圍棋界苦惱更甚。這些年,中韓以圍棋道場為依托,高效地為國傢隊輸送年輕棋手,日本則延續著傳統的內弟子制,成才緩慢。電腦圍棋是他們在圍棋世界裡的另一大依托,最早發力。Zen是前AlphaGo時代UEC杯賽上的明星,去年在日本產學研各界合力之下,Zen也引入深度學習算法,升級為DeepZenGo,不料在本屆UEC杯上兩負絕藝,淪為網友口中的“第三狗”。



3月21日,首屆人機大戰——世界最強棋士戰在日本棋院總部揭幕,DeepZenGo與中日韓三國頂尖棋手羋昱廷、井山裕太、樸廷桓以單循環的方式展開決戰,羋昱廷、樸廷桓先後戰勝DeepZenGo,惟一輸給計算機的是本土作戰的井山裕太,輸棋導致他的排名跌出世界前十——柯潔仍是第一,韓國棋手樸廷桓戰勝中國隊羋昱廷奪冠,排名升至第二,其餘八席也都分別為中韓棋手占據。



2016年11月23日,日本東京,日本第二節圍棋電王戰三番棋決勝局在日本棋院舉行,趙治勛九段戰勝日本人工智能圍棋軟件DeepZenGo,在本次人機對戰中以總比分2:1勝出



按柯潔的說法,DeepZenGo至少比Master弱兩個子,但羋昱廷、樸廷桓也都贏得不輕松。樸廷桓在此前的農心杯上狀態不佳,這次在最強棋士戰上既贏瞭AI,又贏瞭人類,成為第一個“人機對抗”世界冠軍,但捧杯時仍然神色凝重。他接受韓國媒體采訪說自己曾感到悵然,“我以前也想過,總有一天人工智能會在圍棋項目上超越人類,但沒想到這一天會這麼快就到來。”戰勝DeepZenGo並沒能讓他感到輕松,“相對AlphaGo來說,DeepZenGo擺的還是人類的佈局。但AlphaGo經常下出不曾見識過的手段,所以更難以對付。”



樸廷桓對陣DeepZenGo時,李世石在韓國棋院掛盤解說。此前他接受韓國媒體采訪,稱自己的2016年“充滿瞭困苦”——輸給AlphaGo之後,他非常希望在人類比賽中證明自己,“可能是太想贏瞭。以前,我所積累的勝負的經驗可以讓我向好的方面升華,但是和AlphaGo對決後,就做不到這一點瞭。我想在很短的時間內證明點什麼,這種強迫意識可能太強瞭。自然,沒得出什麼好結果。”他甚至萌生退意,“我自己對勝負失去意趣,滿足感下降瞭。如果打分,還不到50分。如果我能享受圍棋的勝負,並能找出意義,就可以說對圍棋的滿意度高。但現在我做不到。”



古力將當下這個階段稱為“人機對抗的第一階段”,“除瞭Master之外,其他AI還不具備絕對實力,它們對陣人類棋手能夠贏棋,但是還談不到碾壓。職業棋手在這個階段,還是要竭盡所能地去贏。”



古力贏得極大贊譽,恰恰是在輸瞭很多棋之後——2010年,他先後在四個重要國際比賽的決賽中失利;2014年,又在關註度空前的“古李十番棋”中敗北,“十番棋是我人生的一道坎。”2015年6月,他第二次捧起春蘭杯,贏得自己的第八個世界冠軍。一位韓國棋迷在網上留言,“古力是很帥的棋手,是大棋士,他的言行,由衷讓人敬佩。如果把圍棋隻當作勝負,哪怕隻是觀戰的角度,也會淪為下品。真誠地對待對手,全力以赴,惺惺相惜,相互敬佩,應該有這種味道。”



“現在輸棋當然還是會難過,不過拋開勝負,還是希望在每盤棋中,自己能夠有一些很滿意的或者是很新穎的招數,”古力說自己現在下棋,漸漸有一種創作的幸福感在裡面。他的微博也呈現出一種活潑自在——關註圍棋AI的進化,不遺餘力地為年輕棋手鼓勁兒。羋昱廷對陣DeepZenGo之前,他參與新浪微博發起的投票並轉發微博,呼喚棋迷們都來給“小米”加油。“就像人肯定跑不過汽車,形成共識之後,也沒有人會要求一個人去跟汽車賽跑。但是現在是人機對抗的第一階段,我們跟AI還是有得下的,圍棋的發揮,信心和情緒的影響可以達到50%以上,人工智能不會有這個問題。”



“活在當下”,柯潔說現在切身體會到這句話的意思,一方面必須“要下好與人類棋手的比賽”,另一方面還要迎戰不斷升級的圍棋AI,“就算無法戰勝,也要鼓起全部勇氣。棋手是不能害怕的,你害怕一個對手,那你的勝算就不高瞭——如果連他的壞棋都被你想成好棋瞭,你拿什麼去作戰鬥的籌碼?一定不能怕,怕,就輸瞭。”



他與AlphaGo對決日期確定之前,曾傳出本屆夢百合杯有可能將一張外卡發給圍棋AI的消息,後來主辦方稱此事待議,“我非常反對在傳統賽事中摻入AI,AI可以跟頂級棋手進行‘特別賽’,進入到傳統賽事裡是不合適的。”



柯潔指著棋盤說,“我自己從這裡得到瞭很多,榮譽、收入……我不懼怕任何AI的邀戰,隻要棋迷愛看,我們不能因為怕輸而拒絕,你享受瞭圍棋帶給你的榮耀,也有責任去為圍棋界承擔更多。但是對於很多也許一生隻有一次機會獲得世界冠軍的棋手來說,輸給一個持外卡的AI,既不公平,也缺乏尊重。”



未知



“棋道一百,我隻知七”,這話出自67歲時仍能在日本圍棋王座戰中衛冕的藤澤秀行九段。古力說,“我以前覺得這當然是前輩自謙,AlphaGo出來後,意識到人類對圍棋的認識恐怕也就是這麼多。即便Master也不是‘圍棋上帝’,我認為它對於圍棋的探索在百分之四十到五十之間,棋盤上的變化它也還無法窮盡。”



羅洗河的話印證瞭這個判斷,“我當然希望絕藝可以進化為完美,希望它能夠像上帝一樣,但這個是很難去證實的。”



絕藝理論上也會進化到更為強大,像Master一樣通殺超一流棋手,“人類棋手不能再跟它們對抗之後,它們自身的缺陷會更難暴露,它們的水平也就很難進一步提升瞭。”古力說自己的心情已經平復瞭,“我現在更願意把AI看作我們棋手的朋友,雖然還有很多招數我們不能完全理解,但在它的影響下,現在下棋的確自由瞭很多。AI基於精確計算形成的大局觀,也是我們渴望學習的。”



柯潔說即便是頂尖棋手,在空曠局面下落子都會有一種無助感,在棋盤前,他常有渺小之感,“窮盡一個局部太難瞭,機器甚至都算不清。我們人隻能憑自己大量的實戰經驗去選擇下在哪裡,機器背後有大量的計算作為支撐,它在空曠局面上的判斷和戰鬥,都是有計算支撐的,這個正是我們容易被拉開距離的地方。”



他喜歡把圍棋形容為孤獨的修行,“我自己是受益於網絡圍棋的,小的時候比賽機會少,就是靠下網棋,網棋裡也會有很多新招。到現在這個階段,一般人很難對我占優,技術上自然也容易出現瓶頸,能夠碰到AI這樣的更強對手,這種感覺其實非常奇妙。”



2017年4月10日,北京,中國圍棋協會、谷歌、浙江省體育局召開新聞發佈會宣佈,三方將於5月23日至27日在浙江烏鎮聯合舉辦中國烏鎮圍棋峰會。前排左起:華學明、谷歌大中華區總裁Scott Beaumont、柯潔、羅超毅,後排中為古力



AlphaGo和Master留下的65盤棋譜,棋手們反復精研,“AlphaGo的招數也並不是我們完全不能理解的,不要這樣去神話它,隻是有些招數我們不那麼用,它那樣下,並且能贏棋,我們會反過來思考其中的價值,”俞斌總教練愛強調自己是“一輩子從事技術工作的”,他樂呵呵地搖著扇子,“那些杞人憂天的問題你就不要問我瞭,從技術上看,我看這是好事,更多新東西進來瞭,訓練上也是非常好的,AI不知疲憊,我們棋手可以從早到晚輪番上陣跟它下。”



劉曉光九段這些天常往隊裡跑,在咖啡室裡端杯咖啡跟大傢聊棋,“AI打開瞭我們對圍棋的想象空間,這些棋譜研究起來真是一種享受。”他理解年輕人的焦灼,“AI忽然成瞭職業棋手請教的對象,心裡肯定會有些失落,但是不能那麼狹隘,人工智能的技術突破以掌握棋盤上的萬般變化作為起跳臺,我們圍棋的價值在這裡其實已經體現出來瞭。”



AI未來將如何發展,我們的生活將如何被它改變?棋手們的話題也經常會跳出棋盤之外。



麥肯錫全球研究所在2017年1月的一份報告中稱,目前人類的工作職責中有一半可能在2055年實現自動化。“AI如果進入傳統賽事,那不就是跟我們職業棋手開始搶飯碗瞭嘛。不過如果AI真能造福人類的話,我覺得我們的尊嚴根本算不上什麼,根本不值得一提啊!有時候也會覺得我們其實是幸運的,首當其沖被AI沖擊和改變,未來如何被AI改變,我們的體會要比普通人更深一點兒。”柯潔說。



泡一杯茶,坐在電腦前,欣賞頂級圍棋AI下棋,對古力來說已經成為一種享受,但談到人工智能邁向“超人類智能”,那時候科技是否還能讓生活更美好,他說自己有點持懷疑態度,“因為它一旦有自主能力,那在社會發展中人類絕對是拖後腿啊。社會進步肯定是淘汰那些能力差的嘛,那時明顯的是人類能力最差,那隻能被淘汰瞭呀。”



那麼,AI會搶走我們的工作?還是重新定義瞭工作?甚至會為人類創造更多更好的工作?它們是設備?是朋友?抑或是人類的掘墓人?每一個議題都是一盤未下完的棋。被AI率先入侵的棋類運動,很自然地被人們當作一個眺望未來的參照。



國際象棋的訓練室與圍棋隊同在一層,如今,依靠計算機和數據分析備戰頂級抽油煙機推薦賽事已經成為慣例,最高水平的選手與計算機專傢聯手量身定制開局,國際象棋大師阿南德說,他的一個主要助手擺滿計算機設備的桌面,看起來“就像飛行員的駕駛艙”。



圍棋隊的訓練模式會不會因為AI的出現而被顛覆?“一人抱臺筆記本?沒有,我們不這麼幹,至少現在還不是這樣的。”俞斌說,“圍棋太復雜瞭,你自己一個人苦思冥想練成絕世武功是不可能的。我們的訓練模式是從聶衛平時代建立的,這也是我們中國圍棋隊最寶貴的傳統,把自己體悟的東西拿出來分享、討論,想辦法說服別人,如果有一招最終被大傢接受,這是最大的認可和榮譽。”



我在一個訓練日的下午又去瞭圍棋隊,訓練室裡十分熱鬧,一二十個小夥子散坐在最大的一間訓練室裡,其中七八個人圍在一張桌前討論。按照隊裡的要求,18歲以下的隊員必須每天來訓練室,而30歲以上的棋手可以自己選擇。俞斌說這樣規定,主要是怕小孩兒貪玩,代傢長行使監護權,其實就水平而言,“十七八歲的男孩子其實是最厲害的,他什麼事情都不考慮,全部精力都在棋上。”



“他們都是各個地方圍棋培訓點裡萬裡挑一比出來的,八九歲就非常厲害,起碼在他們當地的地級市就沒有對手瞭,這個時候他就會被送到全日制的道場裡訓練,不讀書瞭,天天訓練,大概三四年的時間,他們裡面的佼佼者就會入段,然後我們國傢隊就可能會考察他。”



這種極限壓縮速成模式好不好?



俞斌搖著扇子說我又問瞭一個不該他回答的問題,沉吟片刻,他給瞭一個相當實在的答案,“作為國傢隊總教練,我必須感謝道場,他們輸送瞭人才,讓我們跟日本拉開瞭距離。從我自己來看,一個孩子如果文化課缺席,可能是一輩子沒法彌補的,所以如果大傢都能把腳步慢下來,那是好事。”



圍棋AI的出現會使這個競技鏈條發生改變嗎?劉曉光九段搖頭,“也許還會使得訓練更向極限壓縮。”



中國棋院的小院兒被運動員公寓合圍,院子門口停著一排共享單車,幾個長腿運動員從公寓南門出來,在棋院門口掃碼取車。不知他們是否知道,距離幾百米遠的小樓裡,那些看起來完全不像運動員的小夥子們,正在代表著人類,與“未來”激烈交手。



曾經堅固的正在融化,剛剛發生的仍是序曲……在這個時間點上,有一個鏡頭為“人類棋手”留存——李世石大戰AlphaGo後,Facebook的人工智能專傢田淵棟博士這樣寫道,“一邊是需要千臺機器的AlphaGo,另一邊是李世石和手邊的一杯咖啡。大自然的鬼斧神工,一直讓人肅然起敬;而最傑出的造物,莫過於我們人類自己。”



再次對決AlphaGo 人類棋手柯潔的勝算有多大? 柯潔參加《朗讀者》



(文章來源:觀察者網 專欄作者陳經)



醞釀瞭近一年的二次人機大戰終於有瞭正式消息。4月10日,谷歌與中國棋院宣佈,2017年5月23日起,AlphaGo將與柯潔進行三番棋對決。勝者獎金150萬美元,負者出場費也高達30萬美元,是圍棋比賽有史以來的最高獎金。



一、勝一盤的重要性



然而,150萬美元獎金雖高卻像畫餅,幾乎沒人相信柯潔能勝兩盤獲得比賽的勝利。但這不是錢的事,隻要柯潔勝一盤,就能封神瞭。



這次比賽會下滿三盤,古力說柯潔隻有10%的機會勝一盤,還可能樂觀瞭。一些資深棋迷打賭開的賠率也是柯潔勝一盤賠10倍。這相當於說,柯潔和AlphaGo下,30盤才能勝一盤。

X-701/Mini手作鮮食堂|寵物食品|貴賓狗飼料|貴賓狗飼料推薦|紅貴賓飼料|紅貴賓飼料推薦

棋界現在一種說法是,AI戰勝人類帶來圍棋技術的大發展,人類學習AI與AI共同進步。這算是呼應谷歌團隊的姿態,說棋藝有大發展、學習AI,這都沒問題。但圍棋首先是個勝負的遊戲,對職業棋手來說,勝負壓倒一切。圍棋和國際象棋、中國象棋不一樣,和棋極少,輸半目也是輸,更殘酷。現在不能認慫,還是應該爭取戰勝AlphaGo,隻勝一盤意義都大於這150萬美元的獎金。我相信,如果柯潔能勝AlphaGo一盤,倒貼錢他都願意。柯潔自己也是鬥志滿滿,在央視《朗讀者》上讀哈裡波特,把AlphaGo比作伏地魔,聲稱要“零封AlphaGo”。



去年李世石以1:4慘負AlphaGo,震動瞭棋界甚至整個世界,引發瞭人工智能熱潮。《自然》與《科學》都將這個事件列為年度八大、十大科技進展。對外界來說,1:4和0:5似乎區別不大,對棋界就不一樣瞭。如果沒有這一勝,棋手們面對AlphaGo將極度自卑,隻剩下各種恐懼與膜拜。去年人機戰第三盤AlphaGo序盤碾壓李世石,以3:0勝出比賽的時候,棋界氣氛極度壓抑,幾乎沒人再對李世石抱有希望。直到第四盤李世石勝出,棋手們才恍然大悟,原來AlphaGo的命門是計算!整個棋界大緩瞭一口氣。李世石說,這一勝拿什麼也不換,意義真有這麼大。



去年正因為我深深知道人類勝局的重大意義,才在幾乎所有人都絕望的時候,仍然堅持分析AlphaGo的弱點,還真預測到瞭李世石勝出的方式。



Master年初60:0碾壓人類高手,現在棋界的氣氛又和去年3:0時差不多瞭。某種程度甚至更為絕望,因為這回盤數很多有說服力。而且能戰勝人類的AI不隻AlphaGo瞭,還有絕藝和DeepZenGo。好消息是有職業實力的AI隻有這三個,壞消息是連最弱的DeepZenGo都不好對付。



3月18至19日的計算機圍棋UEC杯,絕藝在預賽和決賽中兩勝DeepZenGo,AI界的老二老三座次排定。緊接著3月21至23日的首屆世界圍棋最強戰中,老三DeepZenGo代表AI與中日韓三大高手下瞭三局每方三小時的慢棋,一局完勝兩局憾負,前半盤都是明顯領先。3月26日UEC杯的後續節目電聖戰,絕藝與DeepZenGo都表現上佳擊潰日本新銳一力遼。在野狐圍棋網,絕藝實力不斷進步,在快棋中對人類高手勝率高達9成,並以碾壓態勢率先升為10段。柯潔對絕藝13連敗,已經1個月沒有公開和絕藝下瞭。如果人類連絕藝和DeepZenGo都打不過,那還怎麼和AlphaGo較量?



二、正確認識AlphaGo,消除恐懼



人類棋手的誤區是,總是不由自主把圍棋AI當作人來看待,首先根據戰績判斷AI的實力,其次看棋譜。以前看棋譜覺得AlphaGo實力不強,李世石100萬美元獎金天上掉餡餅。AlphaGo3:0勝出的時候,又覺得AlphaGo不可戰勝瞭,要讓二子。李世石勝瞭一盤,又覺得原來AI有弱點,畏懼心理消除。AlphaGo升級為Master下得又快又好創新很多,又覺得它深不可測,不可戰勝瞭。看DeepZenGo網上戰績,高手們評價不太高,但從最強戰三局慢棋實戰表現來看是低估瞭它。隻有絕藝一直和高手們親密接觸,甚至有能悔棋的內測版,開發人員中也有羅洗河這個世界冠軍,所以棋手們瞭解多些。



圍棋AI是程序,思維和人截然不同,不能象觀察人那樣去想象它的能力。它強的地方,不要低估,它弱的地方,也不要高估。除瞭戰績、棋譜這些擺在明面上的信息,更值得分析的是AI的算法。應該從算法原理去分析,圍棋AI為什麼強,為什麼弱,結合實戰表現,做出合理的解釋與猜想。現在棋界一大問題是對AlphaGo太過懼怕,不少職業棋手對Master可以說是嚇死的,招法完全變形,序盤就敗瞭。不瞭解對手,對手下的招出乎預料就害怕傻眼瞭,時間壓力之下失去正常思維,這根本沒法下棋瞭。



棋界迫切需要盡量瞭解AlphaGo,對它的行為模式建立預期,消除恐懼。Master的60局棋譜,棋手們研究一段時間瞭,有瞭相當的認識。由於谷歌的保密風格,算法上AlphaGo有什麼重大進展信息極少,但也還是有一些可以分析的,本文會從算法角度進行推測。



我的結論是,AlphaGo是個“圍地大師”、“創新大師”,但並不是“戰鬥大師”,棋藝從原理上就存在短板,但是特長極強,掩蓋瞭弱點。柯潔僅僅是消除畏懼心理,恢復平常心是不夠的,這還是傳統思維模式,也不一定做得到。人類高手不能空喊“有信心”之類的口號,需要從理性上確立“獲勝是可以做到的”這個信念,根據AlphaGo的算法特點,改變傳統思維模式,針鋒相對與它戰鬥,爭取在人機戰中獲得勝利突破。柯潔在人類棋手中思維活躍、攪功無敵,是戰勝AlphaGo的最好人選。希望柯潔采用正確戰術,取得一勝。隻要一勝,二次人機大戰就會成為棋手與棋迷的狂歡節。



特別有幫助的是,騰訊開發的絕藝達到瞭極高水平,柯潔和絕藝極為開放的內測版下,可以反復實踐演練自己的想法,並不是悶頭準備。騰訊開發圍棋AI的團隊就有三個,絕藝隻是勝出的那個,這個投入確實很有魄力,如果柯潔能打破AlphaGo的堅冰,棋界要感謝騰訊。



由於絕藝不斷在野狐圍棋網上下,雖然勝率不斷提高,但還是經常輸給職業高手,所以人們可能低估瞭它的實力。絕藝輸主要是出bug,表現正常的時候實力極為可怕,而且在快速進步,要看最近的勝率。業餘六段和職業棋手也就是讓先到二子的差距,據說有業六讓四子和絕藝下20分鐘的慢棋還是輸瞭。絕藝的棋風和AlphaGo不同,創新不多,但是力量太大瞭,出手很敏銳。4月10日開始絕藝在野狐復出下棋每天兩盤,是20分鐘和三次1分鐘讀秒的慢棋。到4月14日,對10位職業高手取得瞭9勝1負的戰績。



通過和絕藝的不斷對局,人類高手已經相信,自己正常1分鐘讀秒的表現會比20、30秒好得多,對絕藝勝率明顯提高(指以前版本,絕藝最新版本又進步瞭)。AI對手和人不是一回事,人類下快棋對AI實力會大降。如果現在的絕藝和人類高手下20秒、30秒的快棋,再加上人類高手不瞭解它,如果它還新手不斷,殺個60:0不是不可想象。有瞭絕藝這個參照物,年初Master的表現也就不是這麼震憾瞭。絕藝雖然在快速進步,但人類高手由於看著它成長的,和它下思維比較正常,表現要好得多。



我這並不是心靈雞湯式的給人類圍棋高手打氣。如果是國際象棋,從算法原理上就知道,人類不可能戰勝AI。國際象棋AI和人下棋的思路差不多,算得比人深遠,無論是局勢評估還是推理搜索,人會的AI全會,還更厲害。國際象棋AI能下出人類無法想象的“AI”棋,人類確實沒理由戰勝AI。但圍棋是另一種遊戲,不僅復雜得多,特點還完全不同。AI和人是用兩種截然不同的思維模式下圍棋,AI學會瞭人的部分本事,還發展出瞭新的本事,在局勢評估上遠遠強於人。但是人也有AI不會的絕招,就是復雜戰鬥、對殺、死活、精確收官等以推理為基礎的圍棋技術,由於AI沒有概念推理的能力,這些任務對AI算法來說很困難。



相當於人和汽車的賽跑比賽,如果是一條平路,汽車必然戰勝人。如果路上有的地方有墻,有的地方有溝,人會翻墻也會下到溝裡再上來,而汽車翻墻過溝不太會,可能會翻車輸給人。人如果選擇在平路和汽車比拼,那當然必輸;如果把比賽引向翻墻過溝的比拼,不僅比賽有趣多瞭,還真可以獲勝。比賽之前人制定戰術的時候,不能說要平常心,要學習汽車的高速度爭取跑出博爾特的水平,那也是輸。為瞭勝利就應該揚長避短,跑步也要會,不要跑步就把腿折瞭退賽。速度落後於汽車不要驚慌,如果能把汽車引向有墻有溝的路段,就能等到時機。

旅館裝潢規畫專家-套房裝潢實例,木製地板鋪設,飯店裝潢,汽車旅館裝潢,飯店裝潢設計,飯店風裝潢

當然AlphaGo的能力很強,很難把它引向表現差的路段,這隻是一個比喻。但可以肯定AlphaGo不是全能的,從算法原理上就有漏洞。最高水平的國際象棋AI互相比賽絕大多數是平局。兩個AlphaGo自我對局總是能分出勝負,也不是每局都差距很小。這中間肯定有大量的局面,在算法的能力之外,AlphaGo執黑或執白隨機地出錯。



三、AlphaGo的算法進步與人類棋手的應對

浴室除臭專家網-浴室除臭,浴室除臭推薦,浴室除臭方法,廁所除臭,廁所除臭推薦,廁所除臭方法

打瞭很多比喻,還是要具體說算法。AlphaGo在去年3月以後,算法框架又有瞭突破。但是從種種跡象來看,圍棋AI下棋還是依靠三大技術:給出搜索候選點的策略網絡、評估局勢的價值網絡、展開搜索樹模擬至終局數子的MCTS(蒙特卡洛樹形搜索),這三大技術全部以“勝率”這樣的概率輸出統一起來。AlphaGo、絕藝、DeepZenGo,以及一些更弱的AI都是這樣下棋的,在基本框架上沒有本質區別,有的沒有價值網絡。谷歌團隊厲害的是,在訓練上有很多突破,做出來的策略網絡、價值網絡在質量與特性上,比其它AI要厲害得多。



在策略網絡上,圍棋AI都是學習人類高手棋譜訓練的,AlphaGo的策略網絡並不突出。這是一個深度學習訓練問題,Facebook的Darkforest在預測人類高手著手時正確率還更高,也有一些業餘開發者做出瞭不錯的策略網絡。AlphaGo展現的高超實力,並不是靠策略網絡,它的開發門檻不高。



但是價值網絡的開發門檻很高。隻有谷歌這種大公司,才能動用十幾萬個服務器產生幾千萬局機器自我對弈棋局,用於價值網絡的訓練。後來騰訊也做到瞭,絕藝自我對弈超過30億局。而DeepZenGo的價值網絡訓練就似乎不容易,開發者加藤英樹抱怨合作公司的支持不夠。DeepZenGo的價值網絡甚至犯瞭這樣一個錯:



2017年3月22日世界圍棋最強戰,DeepZenGo執白負樸廷桓



這個局面左上部的幾個白子是死棋,連業餘棋手都知道。但是DeepZenGo的價值網絡卻判斷是“雙活”,給出瞭完全錯誤的勝率判斷。這個局部看上去和雙活的棋形很象,黑棋要吃掉白要經過一定次序的緊氣。這說明,價值網絡是根據靜態的相似棋形來判斷的,不管怎麼訓練它的搜索能力都很差。絕藝和AlphaGo的價值網絡訓練的棋局數多,表現肯定好些,但也還是靜態的卷積神經網絡計算,不具備動態的搜索能力。



從算法原理上就可以確信,無論怎麼訓練,價值網絡都存在“bug局面”。比如復雜的對殺、局部棋塊死活,價值網絡肯定會作出錯誤判斷。網上實戰,絕藝和DeepZenGo就經常判斷錯誤。AlphaGo的價值網絡肯定也有bug局面,它總是一個靜態的神經網絡,就算系數多達幾百M,也不可能解決需要復雜推理的棋塊死活問題,深度神經網絡沒有這種神奇能力。正如人類高手看一眼棋局,也不能說出局部是死是活,得花些時間計算,除非以前見過這類“局部常形”。



這也是圍棋奇妙的地方,局面稍有差別,價值網絡可能以為是一回事,但死活就可能倒轉,倒轉突變程度遠超國際象棋。價值網絡常見棋形訓練多瞭知道是死是活,但如果局部棋形沒出現過或者訓練不足,就可能發生死活誤判。而且神經網絡深度學習訓練也不是說堆積樣本就一定能全部訓練正確,總會有一定差錯率。訓練會進入瓶頸,這個訓練弄對瞭,原先對的那個又錯瞭。包括策略網絡的訓練,預測人類高手著手正確率隻會是50%多,再高上不去瞭,也沒意義。谷歌可以堆機器把訓練做得更快,但不可能讓價值網絡產生神奇的能力,bug局面絕對大量存在。



據Deepmind透漏,2016年3月以後,AlphaGo的訓練流程確實進入瞭瓶頸,應該是訓練出來的新版對上一個新版棋力提升不多瞭。價值網絡和策略網絡再怎麼訓練,棋力也沒有顯著提高瞭。這時谷歌開發團隊又做出瞭一個創新,可能就是Master神秘實力的重要來源。



之前圍棋AI是學習人類高手棋譜生成策略網絡的,但是人類高手群體其實有很多盲區!就像後來不少高手看到Master的表現說,像開局點三三之類的著手,沒有一個棋手想得到,集體沒往那個方向想,但其實是可行的。學習人類高手棋譜,這些新招隻會有極低的預測概率,就搜索不到瞭。但是開發團隊發現,有些選點,雖然策略網絡不看好,但真要下出來,價值網絡卻給出瞭不錯的評分。可以在訓練中對價值網絡海量嘗試,補充一些勝率不錯的選點給策略網絡,又經過搜索與海量對弈發現,這確實是不錯的選點。這就是Master新招不斷的技術秘密,其實也沒那麼神奇。人類棋手沒有明確的價值網絡,也不可能天天去試一些奇招。而機器自我對弈學習卻可以這麼做,訓練流水線運轉起來後,所有選點都試一下不過是寫個循環,靠機器算力猛試就行瞭。就算絕大部分失敗,隻要找到一些新招就足以震憾人類棋手瞭。



最後結果就是,獲得價值網絡的回贈之後,Master的策略網絡已經和人類棋手很不一樣瞭,人類棋手不敢想的招,Master敢想敢下。Master和人類棋手60局對局,幾乎每局都有這種人類想不到的招,這也是棋手們對Master十分敬畏的來源。人類棋手要創新很難,能不斷下出可行新招的棋手會得到極高的推許,正如吳清源大師,不知道他為什麼那麼能創新。但是Master的創新卻不難理解,就是極高質量價值網絡的附加效應。其實Master的新招下出來以後,人類棋手慢慢也能理解瞭,甚至在實戰中應用瞭。



2016年12月31日,Master執黑對金庭賢


17240

柯潔AI會搶走我們的工作?還是重新定義瞭工作?甚至會為人類創造更多更好的工作?它們是設備?是朋友?抑或是人類的掘墓人?每一個議題都是一盤未下完的棋。被AI率先入

A45B178EFD6B8195
arrow
arrow

    dnd377p5d9 發表在 痞客邦 留言(0) 人氣()