close

柯潔最終戰失敗!回顧AlphaGo全部對戰過程,真正可怕的還在後面……

原標題:柯潔最終戰失敗!回顧AlphaGo全部對戰過程,真正可怕的還在後面……

圍棋領域,人類最強大的大腦,也終於宣告完敗。但這不是我們不給力,而是對手它,不是人啊……

實際上,無論柯潔在今天的棋局上表現如何,AlphaGo在5月23日和5月25日,連續兩場戰勝,從前天起,這個結果已經就被鎖定瞭。在昨日還進行瞭配對賽和團體賽,而在團隊賽中,中國的5位世界冠軍聯手群戰AlphaGo,最後還是執黑254手中盤告負。

圍棋領域,人類最強大的大腦,也終於宣告完敗。

圍棋比賽,看似離我們的生活還比較遙遠。但是,我們又能不能把這場烏鎮的全民關註的棋局,單純看成一場娛樂的表演秀?

在有些人看來,似乎就是如此,我們還沒有看到AlphaGo下圍棋能夠台中做月子中心給我們帶來何等改變。

但對另外一些人來說,這是令人恐懼的開端。機器會和我們一樣思考?它比我們強大,不需要受情緒、感情和身體因素的影響,如果搭配一個強有力的大腦,還有什麼是它不能做的?

我們可以思考的問題,還有很多。AlphaGo究竟因為什麼而如此強大,人類在機器面前是否就全無可以反攻的餘地;除瞭下棋之外,AlphaGo還想告訴我們什麼,它究竟能給未來帶來何等改變;以及,下一場,人類和機器,又將在什麼戰局中對峙?



對弈中的AlphaG台中產後月子中心價格o有多可怕?

我已經很拼瞭。能讓AlphaGo的主機發燙一下也好啊。

——by:柯潔

今天的第三局,在上一局落敗後,柯潔提出本局仍由他執白,哈薩比斯痛快地答應瞭。第三局柯潔“回歸自然”,做回自己,不再受對手的影響。而AlphaGo在開局依然將第一手落在瞭右下角的位置上。雙方前4手常規開局,但隨後AlphaGo下出新手,柯潔開始長考,最終隻能無奈脫先。

讓我們再來回顧一下前幾場棋局,以及AlphaGo讓我們曾經吃驚的地方。

1、勝半目是AlphaGo刻意而為之?

第一場,柯潔執黑先行,以小目、三三開場。經過4小時17分37秒,289手的激戰後,最後AlphaGo以1/4子取勝。盡管這是中國規則中最小的差距,但最可怕的是,賽後人們對此結果的猜測:贏半目,是AlphaGo故意設置好的?

第一局棋到中盤時,阿爾法狗已經領先差不多一個貼目。但是之後,它采取瞭保守的下法,沒有寸土必爭。在賽後點棋的時候,柯潔就苦笑表示:“我很早就知道自己要輸1/4子,AlphaGo每步棋都是勻速,在最後單官階段也是如此,所以我就有時間點目。”

獨立IT評論人keso就在賽後第一時間評論表示這可能是AlphaGo特意而為之。



但業界對此也有不同的看法。畢竟,對於電腦而言,AlphaGo被設定的目標就是勝利,而不是“贏幾目”。AlphaGo給自己的命令,是用最穩妥的方法去贏,哪怕隻是贏半目。極客幫創投合夥人蔣濤就認為,這一說法尚不能證實。但是,他也同樣認可,“最後能夠出現這麼細微的局面,說明棋局是在AlphaGo的掌控之中的。畢竟它要確保的,是結果的勝利。至於勝1目還是勝10目,對電腦來說判斷都是一樣的。”



2、效仿對手開局?評價柯潔近乎“完美”

5月25日,第二局比賽進行。

而比第一戰更加出乎人意料的是,比賽進行到當天中午13:37時,柯潔主動投子認輸,AlphaGo提前一個多小時,中盤取勝。

在第二局,AlphaGo執黑先行。而它在落子前,不同以往地經過瞭思索,最後選擇瞭第一局柯潔采用的小目、三三開局。

這是頗有意味的。要知道,AlphaGo公開問世以來到本次人機大戰之前,一共下瞭70局,包括與樊麾的5局、與李世石的5局、以Master網名在網上下的60局。這70局裡,沒有一局開局就走瞭三三。

而柯潔在本場,則相對更加的沉穩。可以看出,柯潔在佈局的策略上,本局下瞭更大的功夫。甚至在前面十幾手,能夠預料到AlphaGo多步棋的落子。比賽進行到1小時的時候,DeepMind創始人、AlphaGo之父哈比薩斯在自己的推特寫道:“簡直不敢相信,根據AlphaGo的判斷,柯潔現在下得非常完美。”



之前一直有AlphaGo不擅長打劫的傳言,但本局中,面對柯潔引爆的劫爭,AlphaGo處理得非常得當,根本沒有回避打劫之舉。

在左下角的劫爭中,柯潔的一步失誤,頓時讓局勢無可挽回。柯潔在進行瞭近20手的嘗試後,於155手投子認輸。

這一局棋的震動也是無可比擬的。在賽後發佈會上,雙方都承認,當天的棋局,在前面,AlphaGo根本沒有顯示出勝率優勢。DeepMind方也表示:“柯潔在比賽中擁有瞭很多機會,AlphaGo一度無法處理……我們作為開發者,從來沒有見過AlphaGo出現這麼勢均力敵的情況。”

這可以說是,迄今為止,人類棋手在和AlphaGo的對弈中,最精彩的一局。

3、面對劣勢時AlphaGo怎麼辦?認輸、逼隊友認輸……

之後的最有趣和最令人懵逼的一幕,則出現在昨日的配對賽中。這場賽制規定,兩名中國棋手古力、連笑將分別和AlphaGo組隊,雙方對壘。

之前,很多人猜測過,AlphaGo會不會有故意輸掉比賽、或者下臭棋的可能。那麼,當AlphaGo真正面對劣勢時,它是怎麼處理的?這場比賽或許會告訴你答案。

在對決即將結束之時,與古力搭檔的AlphaGo決定投子認輸,古力卻拒絕瞭AlphaGo的要求,仍堅持鏖戰。而之後,AlphaGo的棋路變得越來越消極,最終,古力在不可逆轉的情勢下,也隻得認輸。

不管你如何認為,但明顯,AlphaGo已經成為瞭控制棋局的關鍵。



現在的AlphaGo有多強大?

或許,關於AlphaGo的很多問題,可以在DeepMind對其算法的講解中得到解釋。

早在去年,AlphaGo就已經以4:1戰勝過李世乭。而在今年年初,Master橫空出世,在弈城和野狐兩大圍棋網站上,和各國頂尖棋手快棋對弈,最後以60:0的戰績橫掃棋壇。而賽後,Master自揭真身,正是AlphaGo的最新版本。

而這次在烏鎮和柯潔對弈的,正是Master。年初的對弈中,柯潔已經在快棋上,敗給瞭它。

AlphaGo Master和戰勝李世乭的AlphaGo Lee相比,有哪些區別?第一局賽後,DeepMind首席科學傢席爾瓦在演講中透露,去年與李世乭對戰的AlphaGo Lee有50個TPUs在運作,搜索50個棋步為10000個位置/秒,而昨天打敗柯潔的AlphaGo Master則是在單個TPU上進行遊戲,計算量隻是去年那個版本的十分之一。





和柯潔對戰的是年初戰勝60位高手的AlphaGo Master。

目前的AlphaGo是單機版。

配備瞭4塊TPU。

與去年3月與李世石的比賽時相比,當前的版本在處理計算時所消耗的能量僅為過去的十分之一。

目前,與柯潔對戰的AlphaGo Master的等級分已經接近瞭4800分。

現在的AlphaGo采用強化學習,讓人工智能進行自我博弈,產生更強的神經網絡。這一次AlphaGo用自我對弈訓練出的策略網絡,可以做到不需要更多運算,直接給出下一步的決策。

相比之下,現在的AlphaGo比去年擊敗瞭李世石那一版的AlphaGo Lee相比要“強三子”。

4塊TPU,單機版,完虐瞭人類。而“強三子”的概念是什麼?讓柯潔的反應來告訴你。



如果說打敗瞭李世乭的AlphaGo是利用卷及神經網絡,讓它瞭解規則、瞭解棋局,從而進行處理,那麼,現在的AlphaGo,就增強瞭“思考”能力,並且,可以自學成才瞭。

在這次賽前,很多媒體報道,此次參戰的 AlphaGo 2.0 可能采用瞭全新的算法模型,放棄瞭監督學習,即未先學習人類棋譜的經驗,而是直接通過對戰來獲得認知和能力。但哈比薩斯在賽後發佈會上回答,這明顯是個誤解。AlphaGo還是要學習人類經驗,但這個版本的AlphaGo更依賴自我博弈來學習。

如何讓AlphaGo進行監督學習和強化學習,席爾瓦解釋,是讓AlphaGo先通過訓練形成一個策略網絡,將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分佈。然後,訓練出一個價值網絡,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。也就是說,在這個過程中, AlphaGo不僅會算出自己的最優選項,還會根據自己下過的棋,經過多層處理形成一個“值”,值高意味著自己贏,低意味著對手贏,並在棋局中的某一步判斷是否是關鍵的一步。

並且,AlphaGo的搜索算法能在計算能力之上,加入和人類直覺近似的判斷,讓它更接近人腦。



為什麼選擇棋牌?

那麼,為什麼科學傢都執著於讓機器和棋牌類遊戲過不去呢?讓一個電腦學會下棋,對我們究竟有什麼好處?

原因很簡單。首先,棋牌類是人類智力活動的象征,它的宣傳和號召能力台中頂級月子中心自然也是其他運動所不能比擬的。

其次,自然是因為棋類非常適合作為AI算法的標桿。機器和人對弈,是一個博弈的過程,它具有抽象的特性,而棋牌遊戲的規則非常明確,狀態顯示則比較明確。

而在棋牌類中,圍棋是非常難以攻克的一類。我們都知道,搜索算法的復雜程度取決於分支系數——每一步棋可能的走法。相比起來,國際象棋的平均分支因子大約是35,而圍棋的平均分支因子為250,一局步數為350步,搜索樹有250^350個節點,需要更加復雜和先進的搜索算法。在1997年之前,就沒有出現過有競爭力的圍棋程序。

而戰勝眾多棋手的AlphaGo,使用的是蒙特卡洛樹搜索算法,借助值網絡(value network)與策略網絡(policy network)這兩種深度神經網絡,通過值網絡來評估大量選點,並通過策略網絡選擇落點。

神經網絡系統是以人類大腦為原型的信息處理模式,可以根據特定的輸入產生特定輸出,並實現圖片識別、語音識別等功能。谷歌做瞭兩個神經網絡,一個神經網絡用於動態評估——計算對手下一步棋落子的各自可能性,依靠計算機遠遠超過棋手的計算能力,在某種程度上會占據一定優勢。另一個神經網絡用於靜態評估——評估棋局交戰雙方總體態勢。

谷歌輸入瞭海量棋譜,讓AlphaGo以此為基礎進行瞭難以計數的自我對局,以豐富其數據庫,預測對手的落子。

AlphaGo勝利後,今年1月,在美國賓夕法尼亞,卡內基梅隆大學開發的德州撲克人工智能系統Libratus擊敗瞭四名頂尖人類高手,一舉獲得瞭20萬美元將近和177萬美元籌碼。

德撲和AlphaGo所擅長的圍棋不同。圍棋、國際象棋和西洋雙陸等被AI逐個攻破的遊戲,都是“完美信息”遊戲。也即是,所有玩傢在遊戲中,能夠獲得公開和對稱的確定信息。遊戲中需要作出的決策點的數量,決定瞭機器的計算量。

而與之相比,德撲則是“不完整信息”遊戲。其中包含瞭更多的隱藏信息,每個玩傢掌握的信息都是不對稱的,他隻能看到自己的牌,卻不知道對手的牌,需要根據直覺推測對手手牌,選擇下註和放棄,並判斷對手的打法。因此,“不完整信息”博弈,就成為難以攻克的計算機難題。

而Libratus,基於在匹茲堡超級計算中心大約1500萬核心小時的計算,用算法分析德撲規則,預測所有步驟的勝率,來進行自己的下一步。和AlphaGo用大量棋局做訓練不同,它沒有用專業牌局進行神經網絡訓練,而是用隨機生成的牌局(隨機產生公共牌、底池籌碼、玩傢拿牌概率)和嘗試性的動作帶來的結果(在隨機生成的輸入情況下模擬玩傢跟牌後的結果)來作為訓練數據。Libratus還采用瞭博弈論,它通過納什均衡來計算如何應對對手的招數,通過平衡風險和收益,對自身的下一步進行修正,以期達到收益最大化。其程序名Libratus,就是來源於拉丁文“制衡”。

是的,所以,你知道,風靡我國的“國民運動”麻將,就是不完美信息博弈的一種。目前雖然已經有比較強的AI,但是和人類頂尖高手相比,還是有較大的差距。

柯潔之後,或許我們可以期待一場高水平的麻將人機大賽。

但據微軟亞洲研究院研究員楊懋和秦濤的文章,最難被AI攻克的,還是星際爭霸和我的世界這類遊戲。它們不僅信息不對稱,而且遊戲規則是開放性的。除瞭運行速度上占優勢外,計算機還還需要處理不斷出現的復雜的新情況。現在,計算機還沒有在這些遊戲中證明過自己的能力。

AlphaGo下完棋能做什麼?

“AlphaGo 贏瞭李世石,so what?下圍棋本來的樂趣就是對方下一把臭棋,結果機器不會下臭棋,那還有什麼意思呢?”

——by:馬雲

所以,我們可以意識到,棋牌類遊戲,對於人工智能而言,是一種早期的演練。或許它能夠讓遊戲更有趣味,會挑戰專業棋手的價值,會引發很多人的思考和恐懼,但是,AlphaGo,或者說DeepMind,它的最終目標不僅僅是下棋。DeepMind的最終目標,還是智能助手、醫療和機器人等領域。

谷歌現在有兩套人工智能系統,包括谷歌的機器學習開發者工具TensorFlow,以及DeepMind的AlphaGo系統,AlphaGo未來將計劃應用在醫療看護、自動駕駛車等部分。

在烏鎮的人工智能峰會上,Alphabet 董事長 Eric Schmidt談到機器學習和人工智能引領瞭“智能時代”的發展,他表示:“神經網絡和深度學習的爆發是我所經歷過的最大變革”。他還表示,這些新技術不僅提升瞭日常的生產效率,更為企業帶來瞭無限機遇,尤其是在“醫療、交通以及政務”等領域。而谷歌的各項AI研究成果,也在這場交流中向國內觀眾做瞭完全的展示。



比如機器學習在消費產品中的應用,包括 Google Photos以及Gmail。以 Google Photos最新版本為例,通過機器學習技術,可以將照片中的雨滴去除,台中產後月子並為照片添加濾鏡,使其擁有與知名藝術作品一般的效果。

還比如,如何利用電腦工具幫助缺乏醫療資源的國傢更廣泛地進行眼疾診斷,這其中就包括瞭印度。印度擁有13億人口,總計缺少 127,000 名眼科醫生。Google 的機器學習模型診斷眼疾的準確率,甚至略微高於一些通過美國認證委員會認證的眼科醫生。這個技術還有很大的潛能可以應用到其它疾病的診斷,例如斯坦福的研究者近期已經開始使用 TensorFlow 利用圖像進行皮膚癌的診斷。

TensorFlow 是現在 GitHub 上世界第一的機器學習知識庫,其使用增長率遠遠高於其它同類型平臺。比利時公司Connecterra 就將TensorFlow 應用到瞭牧場當中,而澳大利亞的研究者則將此項技術用於判斷海牛種群的健康狀況。

Google 翻譯也用到瞭TensorFlow。隨著神經網絡機器翻譯的引入,翻譯結果有瞭顯著提高。同時,結合瞭“計算機視覺”使得 Google 翻譯 App 能夠利用手機攝像頭進行即時圖像翻譯,這項功能正是通過TensorFlow 在移動設備上的版本來實現的。在文藝領域,還有“Portrait Matcher” ,一個可以利用攝像頭將你的面部特征與類似藝術品匹配的功能。

柯潔戰後說:“未來是人工智能的。”而人工智能,終究是人類所開發的。

暫時我們也不必擔憂,人類將被機器所完全取代和統治。李開復的答案是,人工智能目前隻有在符合以下三個前提的領域裡,將全面戰勝人類:

第一,有海量的數據;

第二,數據台中五星級月子中心有標準;

第三,單一領域。

在前不久的IT領袖峰會上,李彥宏也說:“強人工智能時代,也許永遠不會到來。”

也許,機器並不值得我們去恐懼。但真正可怕的事實,其實是,我們並不知道,人類會將它推向哪一步……

返回搜狐,查看更多

責任編輯:

聲明:本文由入駐搜狐號的作者撰寫,除搜狐官方賬號外,觀點僅代表作者本人,不代表搜狐立場。

閱讀 ()

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow
    創作者介紹
    創作者 tf8fecx8rv 的頭像
    tf8fecx8rv

    天痕的工作室

    tf8fecx8rv 發表在 痞客邦 留言(0) 人氣()