Ads
Ads
把這兩個神經網路結合起來(決策網路和值網路),我們可以大致預估出現在的情況。這兩個神經網路樹,透過蒙特卡羅演算法,把這種本來不能解決的問題,變得可以解決。
蒙特卡羅演算法 :^(
無記錯, 今次打柯潔既ALPHA GO係由頭學過圍棋, 並無參考過其他棋譜 (即係無行截徑, 始終食哂之前D棋譜已經行少好多錯路), 由0開始揣摩圍棋點玩既系統
無記錯, 今次打柯潔既ALPHA GO係由頭學過圍棋, 並無參考過其他棋譜 (即係無行截徑, 始終食哂之前D棋譜已經行少好多錯路), 由0開始揣摩圍棋點玩既系統
有棋譜同無棋譜去到大數據都唔影響好大
無記錯, 今次打柯潔既ALPHA GO係由頭學過圍棋, 並無參考過其他棋譜 (即係無行截徑, 始終食哂之前D棋譜已經行少好多錯路), 由0開始揣摩圍棋點玩既系統
有棋譜同無棋譜去到大數據都唔影響好大
都唔係既, 可能有D好新穎既打法衍生出黎
始終有舊棋譜GUIDE住, 都係有個框框咁
,「人機大戰」的消息再次傳出,關於人類和 AI 的對抗再次牽動世界的神經。
「我會抱必勝心態、必死信念。我一定要擊敗 AlphaGo!」對於 5 月 23 日至 27 日與圍棋人工智慧程式 AlphaGo 的對弈,目前世界排名第一的中國職業九段柯潔放出豪語。然而,AlphaGo 之父卻說,「我們發明 AlphaGo,並不是為了贏得圍棋比賽。」
AlphaGo 之父德米斯 · 哈薩比斯(Demis Hassabis)近日在母校英國劍橋大學做了一場題為「超越人類認知的極限」的演講,解答了世人對於人工智慧,對於 AlphaGo 的諸多疑問——過去 3000 年裡人類低估了棋局哪部分的重要性?
AlphaGo 去年贏了韓國職業九段李世乭靠哪幾個絕招?今年年初拿下數位國際大師的神秘棋手 Master 究竟是不是 AlphaGo?為什麼圍棋是人工智慧難解之謎?
德米斯 · 哈薩比斯,DeepMind 創辦人,AlphaGo 之父,4 歲開始下西洋棋,8 歲時在棋盤上的成功促使他開始思考兩個至今令他困擾的問題:第一,人腦是如何學會完成複雜任務的?第二,電腦能否做到這一點?17 歲時,哈薩比斯就負責了經典模擬遊戲《主題公園》的開發,並在 1994 年發表。他隨後讀完了劍橋大學電腦科學學位,2005 年進入倫敦大學學院,攻讀神經科學博士學位,希望瞭解真正的大腦究竟如何運作,以此促進人工智慧的發展。2014 年他創辦公司 DeepMind,公司產品 AlphaGo 在 2016 年大戰圍棋冠軍李世乭事件上一舉成名。
哈薩比斯在當天的演講中透露了韓國棋手李世乭去年輸給 AlphaGo 的致命原因,他最後也提到了 AlphaGo 即將迎戰的中國棋手柯潔,他說,「柯潔也在網上和 AlphaGo 對決過,比賽之後柯潔說人類已經研究圍棋研究了幾千年了,然而人工智慧卻告訴我們,我們甚至連其表皮都沒揭開。異曲同工,柯潔提到了圍棋的真理,我們在這裡談的是科學的真理。」
以下為演講筆記全文:
非常感謝大家今天能夠到場,今天,我將談談人工智慧,以及 DeepMind 近期在做些什麼,我把這場報告命名為「超越人類認知的極限」,我希望到了報告結束的時候,大家都清晰瞭解我想傳達的思想。
1. 你真的知道什麼是人工智慧嗎?
對於不知道 DeepMind 公司的朋友,我做個簡單介紹,我們是在 2010 年於倫敦成立了這家公司,在 2014 年我們被 Google 收購,希望藉此加快我們人工智慧技術的腳步。我們的使命是什麼呢?我們的首要使命便是解決人工智慧問題;一旦這個問題解決了,理論上任何問題都可以被解決。這就是我們的兩大使命了,聽起來可能有點狡猾,但是我們真的相信,如果人工智慧最基本的問題都解決了的話,沒有什麼問題是困難的。
那麼我們準備怎樣實現這個目標呢?DeepMind 現在在努力製造世界上第一台通用學習機器,大體上學習可以分為兩類:一種就是直接從輸入資料和經驗中學習,沒有既定的程序或者規則可循,系統需要從原始數據自己進行學習;第二種學習系統就是通用學習系統,指的是一種演算法可以用於不同的任務和領域,甚至是一些從未見過的全新領域。大家一定會問,系統是怎麼做到這一點的?
其實,人腦就是一個非常明顯的例子,這是有可能的。關鍵在於如何透過大量的數據資源,尋找到最合適的解決方式和演算法。我們把這種系統叫做通用人工智慧,來區別於如今我們目前大部分人在用的,僅在某項領域發揮特長的狹義人工智慧,這種狹義人工智慧在過去的 40-50 年非常流行。
IBM 發明的深藍系統(DeepBlue)就是一個很好的狹義人工智慧的例子,他在上世紀 90 年代末期曾打敗了西洋棋冠軍蓋瑞 · 卡斯帕羅夫(Gary Kasporov)。如今,我們到了人工智慧的新的轉捩點,我們有著更加先進、搭配得更好的技術。