李世石
縱觀全盤,計算機(jī)Alpha Go出現(xiàn)了兩次較小的失誤,最終沒有影響大局;而李世石卻犯下了一個重大失誤,直接導(dǎo)致最后丟掉了比賽。
之后的比賽李世石能否捍衛(wèi)人類尊嚴(yán)?這臺在第一盤擊敗了韓國棋王李世石的Alpha Go到底是一臺怎樣的超級計算機(jī)?
據(jù)谷歌旗下DeepMind公司CEO兼谷歌副總裁戴密斯-哈薩比斯透露,DeepMind為AlphaGo輸入了海量的職業(yè)棋手對局,其自我演繹的對局?jǐn)?shù)更是達(dá)到了3000萬局,相當(dāng)于人類1000年的學(xué)習(xí)量。
Alpha Go的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò)——“策略網(wǎng)絡(luò)”(Policy network)和“價值網(wǎng)絡(luò)”(Value network)。
“策略網(wǎng)絡(luò)”負(fù)責(zé)減少搜索寬度,排除明顯錯誤的著法;“值網(wǎng)絡(luò)”負(fù)責(zé)減少搜索深度,通過對局勢的判斷,在明顯劣勢下果斷拋棄某些路線,不用每條道算到黑。
通過這兩個網(wǎng)絡(luò)分析局面,Alpha Go會更像一個人類棋手,通過對當(dāng)前局面的判斷和對未來局面的推演,根據(jù)不同權(quán)重,在函數(shù)中算出一種贏的概率最高的著法。
看到這里不少對于人工智能不甚了解的文科生可能已經(jīng)暈了——什么策略、價值,什么寬度、深度,光是這么解釋完全抓不到要點(diǎn)!說到底這Alpha Go和十多年前的深藍(lán)相比有哪些突破性的進(jìn)步?這人工智能下圍棋到底又比下象棋難在哪?且聽小編來給你講講人話。
為什么計算機(jī)挑戰(zhàn)國際象棋10多年前就成功,圍棋卻不行?
國際象棋每回合有35種可能,一盤象棋可達(dá)80回合,在計算方面,國際象棋最多會有10的47次方局面;而圍棋每回合有250種可能,一盤棋可長達(dá)150回
合。對于一個19x19的圍棋棋盤而言,一共有361個位置,而每個位置可以單獨(dú)放置黑棋、白棋或者留空,理論上所有的可能組合是3^361種,其合法的
組合超過170位數(shù)。
170位數(shù)是什么概念呢?如果有這個數(shù)量級的水分子,將足以填滿整個宇宙!
在十多年前,深藍(lán)在國際象棋上戰(zhàn)勝了當(dāng)時的國際象棋棋王卡斯帕羅夫,其原理其實(shí)是讓人工智能在計算上窮盡了所有的可能,但如果挑戰(zhàn)項(xiàng)目換成圍棋,170位數(shù)的可能性,無論在當(dāng)時還是現(xiàn)在,都遠(yuǎn)遠(yuǎn)超過了計算機(jī)的計算能力。
因此,在Alpha Go每下一步圍棋的時候,并不能計算盡所有的可能性下一招“必勝之棋”,而是通過上面提到的“策略網(wǎng)絡(luò)”和“價值網(wǎng)絡(luò)”的分析,做出一種獲勝概率更高的選擇。
這種從深藍(lán)到Alpha Go的深度神經(jīng)網(wǎng)絡(luò)運(yùn)用的變化,恰恰使得Alpha Go的運(yùn)行方式更像人類——也就是說要進(jìn)行“取舍”。
另外,除了深度神經(jīng)網(wǎng)絡(luò)算法之外,Alpha Go還通過蒙特卡羅樹搜索吸收以往棋局的經(jīng)驗(yàn),同時另一邊進(jìn)行著自我對局。
蒙特卡羅樹搜索是把預(yù)測走棋、采樣走棋、提升速度、預(yù)測局面 的各部分連起來,組成了一個完整的系統(tǒng)。
下面這個是國際象棋的。
國際象棋蒙特卡洛樹
這個是圍棋的。
圍棋蒙特卡洛樹
同樣,這種從局部到整體,對知識進(jìn)行分層的結(jié)構(gòu)計算方式與之前相比更加統(tǒng)一,從人類思維的角度來看,其獲得的知識也就更接近圍棋的本質(zhì)。這也就是為什么圈內(nèi)人士都認(rèn)為,如果人工智能能夠在圍棋上戰(zhàn)勝人類,將代表人工智能進(jìn)入了一個新階段。
最后,這個內(nèi)行看門道,外行就湊個熱鬧。講道理的話,小編其實(shí)還是支持我們的人類代表李世石的。
(看看新聞網(wǎng)記者:楊城)
劍網(wǎng)行動舉報電話:12318(市文化執(zhí)法總隊(duì))、021-64334547(市版權(quán)局)
Copyright ? 2016 Kankanews.com Inc. All Rights Reserved. 看東方(上海)傳媒有限公司 版權(quán)所有