close
人工智能論壇:AlphaGo團隊分享技術細節
5月24日,人工智能高峰論壇在浙江桐鄉舉行。AlphaGo團隊向大傢分享技術細節。
江鑄久、芮乃偉、徐瑩等棋手與哈薩比斯交流
各位嘉賓的領域:
劉知青台中清化糞池推薦:我們的計算機學院有十年瞭,祝賀AlphaGo這麼快就取得我們以為很久才能實現的成就。我們爭取自主研發這些技術並在其他領域裡去廣泛應用。
周健工:蒙特卡洛搜索樹很早就有,為何DeepMind現在能實現這些成就?
劉知青:我認為是數據認識和數據質量上的優化有瞭飛躍。
李佳:GPU和TPU的出現,信息分享,感興趣這個領域的人才越來越多,大傢添磚加瓦,讓人工智能領域得到發展。
陳剛:我覺得需要有百分之二三十人員去實現應用化,比如在醫學、教育等領域,其他人去嘗試理論上突破。
傑夫迪恩:人工智能和其他領域不太一樣,很開放,大傢很快出結果發論文,互相閱讀交流,在此基礎上不斷取得新台中水肥清運進展。需要不斷學習,在很多領域需要機器學習。目前可能僅有一萬個公司,我認為至少應該有1500萬個公司采用機器學習技術。第二個是,我們需要專業化模型組建,來實現更多功能和目標。
傑夫迪恩:比如在教育領域,我們需要教孩子、測試孩子是否領悟,有點像定制的私教。
劉知青:機器學習有感知、抽象、應用、回饋過程,另外隨著機器學習的應用,可以幫助人解脫一定負擔,比如計算、檢索、記憶等方面,從而可以去做更多創造性的工作,人工智能不是解決人,而是解放瞭人。
周健工:未來可能是機器智慧與人類智慧相結合,會在哪個領域?
傑夫迪恩:我來講講衛生保健。今天的醫生經驗也是有限的,可能幾十年隻看瞭幾千病人。而如果把所有醫生的經驗總結在一起,在看病時給醫生提建議,可以有助於醫生給病人更好的護理。
李佳:我本來也想說醫療。機器計算力和人的創造力相結合,醫生經驗和機器數據相結合,醫藥研發也是很好的例子,並且可以運用到其他行業,比如農業上預測稻谷產量,從衛星雲圖去發掘天氣,再結合人類千年來知識積累,來產生難以想象的結果。
陳剛:個性化教育領域,孔老夫子兩千年前就說有教無類,或者說因材施教,但現在實際上還做不到,老師效率還太低,一個班學生很多,很難做到一對一。基於人工智能大數據,有可能實現完全的因材施教。
劉知青:交通物流。我們看到在圍棋取得突破性進展,在交通物流方面,怎麼能實現資源高效利用率,是人工智能可以突破的方向。
周健工:人工智能能否產生自我意識或自主的動機?
傑夫迪恩:不知道。我們這麼多算法就是希望優化人工智能,但不知道能否產生自主的動機。保證安全是第一位的,包括自動駕駛,保證他的行為是按照我們的預期
陳剛:我覺得這是哲學問題瞭。
周健工:比如AlphaGo可以走出創新的不可預期的一步嗎?
傑夫迪恩:AlphaGo可以走出創造性的招法。
李佳:人工智能是實現我們目的的工具,還處在非常早的時期,所以現在提還為時過早。
劉知青:關於自主的動機,目前還看不到,正如李佳所說還處在很早的初期階段,今後發展還未可知。
第一財經傳媒集團CEO周健工:AI在哪些領域應用最多?
圓桌討論:
周健工:昨天的圍棋比賽,看到AlphaGo的勝率曲線一路上升。人工智能在飛速進步,機器智慧是否會超過人類智慧?
北郵教授劉知青:人類智慧與機器智慧是兩種不同智慧,不太容易直接比較。一般家庭抽肥比如AlphaGo是以勝率為基礎,人類可能是從招法好壞來判斷,兩者結合可能會發揮更大效果。
谷歌Cloud AI研發主管李佳:機器和人會發揮各自長處。
浙江大學計算機學院副院長陳剛:機器在運算、記憶等很多方面都很強大,但還需要進一步發展。
谷歌Brain傑夫迪恩:人工智能做翻譯還不能取代人類,應用是非常廣泛的,機器學習還不能達到人類能力,如果相結合會變得更強大
施密特:在醫療領域可以有很廣泛應用,未來5年會帶來巨大變化和提升。在中國變化巨大,中文已成為互聯網影響巨大的語言之一。iPhone和安卓僅出現十年,現在很難想象離開手機如何生活。我看到最大的變化就是神經網絡和深度學習。以前如果程序最開始出錯就很難辦,現在借助摩爾定律機器變得快多瞭,機器學習可以自我學習幫助進步。之前我們嘗試過很多方式,現在的技術如果在20年前的電腦上運行不瞭,現在有瞭第二代TPU等新設備的支持,可以讓我們的算法得到很大提升。
如今信息爆炸時代,我們可以通過一些軟件工具來幫助管理。現在的科學傢已無法讀完所有文獻,而人工智能可幫助科學傢有選擇的閱讀,與他人異地分享閱讀。Tensor Flow可以幫助其他公司,比如BAT公司有上百萬用戶群,如果用Tensor Flow可以在很多方面有幫助。
人工智能是可以走進尋常百姓傢,讓更多人受益,並非少數人專屬,人工智能可以推動方方面面進步。我們也希望讓更多人得到好處。中國也在方方面面飛速發展。人工智能並非會讓更多人失業。目前撫養比越來越高,我們希望通過技術來不斷調優這個比例。
DeepMind給我的啟示是,神經網絡等不同領域科學傢可以聚到一起,去實現強人工智能。人工智能開啟美好未來。多年來我都在想,如果我年輕二三十歲會怎麼做,我會加入DeepMind公司。DeepMind在做的,是萬裡長征第一步。盈利的最重要一步,是在科研、醫療等多個領域通過Tensor Flow來實現。信息安全已不再是技術問題,用加密方式就可以實現。隱私則因國情不同而不同。
周健工:BAT擁有巨量數據和技術,如果將來人工智能推動世界進步,美國五大巨頭和中國三大巨頭等是否會壟斷這種進步?
施密特:我不這麼認為。實際上能看到很多新企業傢,會不斷展現出來,很多領域,包括無人機、醫療等等。我們希望在不同行業踐行人工智能優先的原則,可以受益十億人,我們希望這個願景可以實現。
Alphabet董事長埃裡克施密特:我們以前不清楚柯潔參賽會如何,結果差距非常小,說明柯潔準備充分。我想柯潔也借鑒瞭AlphaGo的思路和招法,李世石在首爾也試圖打敗AlphaGo,非常期待明天的第二局比賽。AI對我們的影響越來越大,比如用拍照的方式來幫助翻譯,用很小的團隊非常少的投入就能實現。
谷歌Tensor Flow已運行兩年多,第二代Tensor上周發佈,第二代TPU是針對訓練及推理設計的,比市面上最好的32臺GPU快4倍。TPU艙室有64臺第二臺TPU,每秒11.5千萬億次浮點運算,內存四百萬兆字節,二維環狀多跳網絡。谷歌向致力於研究開放式機器學習的頂尖研究人員免費開放1000臺配有TPU的雲虛擬機。
自動化機器學習(學會學習):機器學習模型的設計極其復雜,學會學習,我們能自動解決很多學習問題嗎?
現狀:模型=數據+計算+機器學習技能(有限供應量阻礙使用量的增長)
方案:模型=數據+100×計算
研究模型,學習優化方程,學習探索方向。
關於智能搜索,未來可查詢的問題示例:“哪副眼部圖像顯示糖尿病性視網膜病變癥狀”“用西班牙語描述這段視頻”“請從廚房為我倒一杯茶”“幫我找出與機器強化學習相關文件並用中文總結一下”。
人工智能有很多可能性,正在產生巨大影響,並且有非常廣泛的發展可能。
傑夫迪恩:當我們面對大量照片時,可以自動識別添加標簽分類;目前谷歌20%的移動搜索是通過語音完成的;Inbox智能回復中12%的回復是用手機發送的。谷歌圖像處理:降噪、消除雨點、欄桿,藝術化處理,明暗識別等等。也應用在谷歌助手裡。端到端的信號+人類模仿。使用機器學習改善健康醫療水平。
deepmind團隊預測,master版本比李世石版本提升瞭三子
傑夫迪恩:人工智能如何工作。
人工智能創造出智慧的電腦,機器學習創造出會學習的電腦,從而完成偉大的壯舉。神經網絡是通過不斷輸入像素等內容參數,根據結果不斷來調優,來達到準確的輸出結果,培訓出模型,直到自己能找到準確答案。包括通過像素識別內容、音頻轉換文字、翻譯、甚至看圖來作文。
2011年,神經網絡識別圖像的錯誤率是26%,而人類是5%。到2016年,神經網絡的錯誤率已經達到3%,打敗瞭人類,隻用瞭5年的時間。
在學習英語到韓語的翻譯時,也同時學習英語到日語的翻譯,從而達到更好效果,也自動學會日韓之間的翻譯。現在我們有強大計算能力、大量訓練數據等從而實現目標。即時相機翻譯如何運作?首先拍攝圖片找出每個字母再翻譯。
大衛席爾瓦:介紹AlphaGo算法。
為什麼選擇圍棋?它是人類最古老、研究最深入的遊戲;是構建理解運算的最佳試驗臺;人工智能面臨巨大挑戰:遊戲大至可以進行窮舉搜索。
我們利用卷積神經網絡來實現,原版AlphaGo有12層,Master有40層。我們用策略網絡和價值網絡來解決問題,策略網絡進行落子選點,價值網絡進行評估。通過人類棋譜來進行監督式學習,調整參數來達到理想效果,通過策略網絡來進行強化學習,自我對局成千上萬盤,通過價值網絡來評估,預測每一步棋後終局的輸贏。
如果用窮舉搜索,范圍實在太大,我們需要簡化減少搜索量,通過策略網絡來聚焦幾個有可能的選項,用價值網絡來降低搜索深度。就是AlphaGo的樹搜索,從樹根開始,一個搜索基礎上加上一個新搜索,最終把結果提交給樹頂。這個過程會重復成百上千次,直到發現哪一步贏棋概率最高。AlphaGo Lee在谷歌雲上有50 TPUs在運作,搜索50個棋步為10000個位置/秒,於2016年在首爾大敗李世石。
AlphaGo並不是比深藍更聰明,而是用價值策略網絡減少瞭搜索范圍。AlphaGo Master版本更強大,在單個TPU機器上進行遊戲,相當於AlphaGo成為自己的老師,從自己的搜索裡學習,使用最好的來自AlphaGo自己的數據;更強大的策略/價值網絡。TPU在谷歌雲上可供大傢使用。
AlphaGo Master強化學習如何實現:AlphaGo與自己對弈,強化學習,自己吸取經驗來改進。策略網絡P以預測AlphaGo的移動,價值網絡V以預測獲勝者。比如通過復盤發現那一步是勝招,是第10步,我們通過這樣的方式反復迭代,新策略和價值網絡用於AlphaGo的下一個迭代中,新版AlphaGo可以得到更好結果和數據,達成良性循環。
AlphaGo的表現如何呢?以圍棋等級分來看,以前ZEN、CrazyStone軟件達到約2000分,樊麾版AlphaGo達到3000分,李世石版AlphaGo上漲3子,達到3500分,AlphaGo Master又漲3子,達到4500分以上。
DeepMind深度強化學習的目標是:超越AlphaGo。比如在3D射擊遊戲中,深度強化學習完全通過收到的像素來自我推理學習,達到人類的能力。通過不斷學習應對未來的挑戰。
去年的AlphaGo 與此次AlphaGo 不同之處。
未來能看到人機結合的巨大力量,1+1 2,在AI支持下人類能變得更加強大,有點像哈勃望遠鏡探索宇宙,人工智能讓我們更好瞭解世界,為人類所用的好工具,在科學、醫學等領域幫助人類進步。我們尋求最優,探尋距離最優還有多遠,怎樣才是完美的棋局;3000年對弈都不足以找到最佳棋局;AlphaGo讓我們可以探尋這些有趣奧秘;無數其他領域也將遭遇“組合轟炸”;強人工智能是我們研究和探尋宇宙的終極工具。
在科學研究、新藥研制等領域,不僅在玩遊戲,也要在現實生活中應用,在數據中心優化方面,我們能節省谷歌中心40%電能。元解決方案:信息過載和系統冗雜是巨大挑戰;開發人工智能技術可能是這些問題的元解決方案;目標:實現“人工智能科學傢”或“人工智能輔助科學”;和所有強大的新技術一樣,在倫理和責任約束中造福人類。我對自己大腦也非常感興趣,包括如何運作、做夢等等,希望人工智能幫助我們更好瞭解自己。
哈薩比斯:李世石表示人機大戰給瞭圍棋新啟發,這令人歡欣鼓舞。關於直覺,就是通過體驗直接獲得初步感知,但無法言傳、表達出來,可通過行為確認其存在和正誤。而創造力是通過組合已有知識產生新穎獨特想法的能力,AlphaGo顯然已在圍棋上展現出瞭創造力。我們希望打造完美的AlphaGo。在首爾的比賽顯示AlphaGo還有不足,我們希望彌補他的空白,在網上以Master的名字來做測試,獲得60比0的佳績,棋手們獲得很多啟發。展現出很多新招法,比如點三三、序盤連續爬二路,等等。柯潔表示人與AI應攜手並進,古力也表示人與AI合作的時代大幕已拉開。卡斯帕羅夫也在書中說,深藍已結束,而AlphaGo才剛開始。AlphaGo有點像吳清源在三四十年代一樣帶來圍棋新時代。棋類程序講戰術,而AlphaGo講戰略。
哈薩比斯回顧去年與李世石的比賽
戴密斯哈薩比斯:今天我將介紹如何賦予機器創造力,以及DeepMind在做什麼。DeepMind2010年創立於倫敦,2014年加入Google,目前進行人工智能“阿波羅計劃”,發現研發科學新方式。我們第一步是要攻克智能。打造通用型學習機器,非程序預設——自主學習原始材料;通用:同一系統可執行多種任務。用原先的經驗應對新挑戰。核心技術是深度學習和強化學習。
通用型的強人工智能與弱人工智能不一樣。最好的例子就是深藍擊敗卡斯帕羅夫,智能之處是用既定代碼輸入深藍,還不算強化學習。
強化學習框架:智能體通過觀察建模來瞭解環境,從而做決定計劃行動,應對挑戰,強人工智能就能實現,從而幫助到人。
雅達利智能體:包括百餘款八十年代的八位雅達利遊戲。通過深度強化學習,在進行300次遊戲後發現捷徑明顯變得更加善於遊戲,獲得更好策略,這是三年前的情況。
這兩年AlphaGo團隊專註於圍棋項目,因圍棋復雜程度讓窮舉搜索都難以解決:“不可能”寫出評估程度已決定誰贏;搜索空間太過龐大。
圍棋與國際象棋相比,不光是簡單計算,更需要直覺。比如問國象棋手,他會說自己有明確的逐步計劃。而圍棋手可能不僅靠計算,而是靠直覺;圍棋中沒有等級概念,所有棋子都一樣;棋盤是空的,要在心中不斷摸索預測未來,圍棋是建築遊戲,因此需要盤算未來;小小一子可撼全局,牽一發而動全身;“妙手”如受天啟,玄妙深奧,好像天賦靈感。
如何才能化繁為簡,是通過兩種網絡來實現:策略和估值網絡。我們在《自然》雜志發表論文,很多公司也隨之作出瞭很不錯的人工智能圍棋程序。去年AlphaGo與李世石的人機大戰令韓國萬人空巷,AlphaGo最終獲勝,這一刻等瞭十年,可以說是十年磨一劍。在第二局中,AlphaGo第37步棋是我最喜歡的,讓世人驚嘆,他走出五路尖沖,是讓人難以想象的。如果在三路是重視實地,在第四路下棋更重視中央,而在第五路下棋則很少,似乎有些落空的感覺,自古人類都低估瞭在五路下棋的價值。而AlphaGo左下早早的兩顆黑子在50步後發揮出瞭作用。而李世石在第四局走出的那一手也顯示出他的天才,那次人機大戰有2.8億觀眾、3.5萬篇報道、棋盤銷量增長10倍。
上臺前的哈薩比斯,今天他會和大傢分享些什麼呢?
參加論壇的樊麾和黃博士
5月24日,人工智能高峰論壇在浙江桐鄉舉行。AlphaGo團隊向大傢分享技術細節。
江鑄久、芮乃偉、徐瑩等棋手與哈薩比斯交流
各位嘉賓的領域:
劉知青台中清化糞池推薦:我們的計算機學院有十年瞭,祝賀AlphaGo這麼快就取得我們以為很久才能實現的成就。我們爭取自主研發這些技術並在其他領域裡去廣泛應用。
周健工:蒙特卡洛搜索樹很早就有,為何DeepMind現在能實現這些成就?
劉知青:我認為是數據認識和數據質量上的優化有瞭飛躍。
李佳:GPU和TPU的出現,信息分享,感興趣這個領域的人才越來越多,大傢添磚加瓦,讓人工智能領域得到發展。
陳剛:我覺得需要有百分之二三十人員去實現應用化,比如在醫學、教育等領域,其他人去嘗試理論上突破。
傑夫迪恩:人工智能和其他領域不太一樣,很開放,大傢很快出結果發論文,互相閱讀交流,在此基礎上不斷取得新台中水肥清運進展。需要不斷學習,在很多領域需要機器學習。目前可能僅有一萬個公司,我認為至少應該有1500萬個公司采用機器學習技術。第二個是,我們需要專業化模型組建,來實現更多功能和目標。
傑夫迪恩:比如在教育領域,我們需要教孩子、測試孩子是否領悟,有點像定制的私教。
劉知青:機器學習有感知、抽象、應用、回饋過程,另外隨著機器學習的應用,可以幫助人解脫一定負擔,比如計算、檢索、記憶等方面,從而可以去做更多創造性的工作,人工智能不是解決人,而是解放瞭人。
周健工:未來可能是機器智慧與人類智慧相結合,會在哪個領域?
傑夫迪恩:我來講講衛生保健。今天的醫生經驗也是有限的,可能幾十年隻看瞭幾千病人。而如果把所有醫生的經驗總結在一起,在看病時給醫生提建議,可以有助於醫生給病人更好的護理。
李佳:我本來也想說醫療。機器計算力和人的創造力相結合,醫生經驗和機器數據相結合,醫藥研發也是很好的例子,並且可以運用到其他行業,比如農業上預測稻谷產量,從衛星雲圖去發掘天氣,再結合人類千年來知識積累,來產生難以想象的結果。
陳剛:個性化教育領域,孔老夫子兩千年前就說有教無類,或者說因材施教,但現在實際上還做不到,老師效率還太低,一個班學生很多,很難做到一對一。基於人工智能大數據,有可能實現完全的因材施教。
劉知青:交通物流。我們看到在圍棋取得突破性進展,在交通物流方面,怎麼能實現資源高效利用率,是人工智能可以突破的方向。
周健工:人工智能能否產生自我意識或自主的動機?
傑夫迪恩:不知道。我們這麼多算法就是希望優化人工智能,但不知道能否產生自主的動機。保證安全是第一位的,包括自動駕駛,保證他的行為是按照我們的預期
陳剛:我覺得這是哲學問題瞭。
周健工:比如AlphaGo可以走出創新的不可預期的一步嗎?
傑夫迪恩:AlphaGo可以走出創造性的招法。
李佳:人工智能是實現我們目的的工具,還處在非常早的時期,所以現在提還為時過早。
劉知青:關於自主的動機,目前還看不到,正如李佳所說還處在很早的初期階段,今後發展還未可知。
第一財經傳媒集團CEO周健工:AI在哪些領域應用最多?
圓桌討論:
周健工:昨天的圍棋比賽,看到AlphaGo的勝率曲線一路上升。人工智能在飛速進步,機器智慧是否會超過人類智慧?
北郵教授劉知青:人類智慧與機器智慧是兩種不同智慧,不太容易直接比較。一般家庭抽肥比如AlphaGo是以勝率為基礎,人類可能是從招法好壞來判斷,兩者結合可能會發揮更大效果。
谷歌Cloud AI研發主管李佳:機器和人會發揮各自長處。
浙江大學計算機學院副院長陳剛:機器在運算、記憶等很多方面都很強大,但還需要進一步發展。
谷歌Brain傑夫迪恩:人工智能做翻譯還不能取代人類,應用是非常廣泛的,機器學習還不能達到人類能力,如果相結合會變得更強大
施密特:在醫療領域可以有很廣泛應用,未來5年會帶來巨大變化和提升。在中國變化巨大,中文已成為互聯網影響巨大的語言之一。iPhone和安卓僅出現十年,現在很難想象離開手機如何生活。我看到最大的變化就是神經網絡和深度學習。以前如果程序最開始出錯就很難辦,現在借助摩爾定律機器變得快多瞭,機器學習可以自我學習幫助進步。之前我們嘗試過很多方式,現在的技術如果在20年前的電腦上運行不瞭,現在有瞭第二代TPU等新設備的支持,可以讓我們的算法得到很大提升。
如今信息爆炸時代,我們可以通過一些軟件工具來幫助管理。現在的科學傢已無法讀完所有文獻,而人工智能可幫助科學傢有選擇的閱讀,與他人異地分享閱讀。Tensor Flow可以幫助其他公司,比如BAT公司有上百萬用戶群,如果用Tensor Flow可以在很多方面有幫助。
人工智能是可以走進尋常百姓傢,讓更多人受益,並非少數人專屬,人工智能可以推動方方面面進步。我們也希望讓更多人得到好處。中國也在方方面面飛速發展。人工智能並非會讓更多人失業。目前撫養比越來越高,我們希望通過技術來不斷調優這個比例。
DeepMind給我的啟示是,神經網絡等不同領域科學傢可以聚到一起,去實現強人工智能。人工智能開啟美好未來。多年來我都在想,如果我年輕二三十歲會怎麼做,我會加入DeepMind公司。DeepMind在做的,是萬裡長征第一步。盈利的最重要一步,是在科研、醫療等多個領域通過Tensor Flow來實現。信息安全已不再是技術問題,用加密方式就可以實現。隱私則因國情不同而不同。
周健工:BAT擁有巨量數據和技術,如果將來人工智能推動世界進步,美國五大巨頭和中國三大巨頭等是否會壟斷這種進步?
施密特:我不這麼認為。實際上能看到很多新企業傢,會不斷展現出來,很多領域,包括無人機、醫療等等。我們希望在不同行業踐行人工智能優先的原則,可以受益十億人,我們希望這個願景可以實現。
Alphabet董事長埃裡克施密特:我們以前不清楚柯潔參賽會如何,結果差距非常小,說明柯潔準備充分。我想柯潔也借鑒瞭AlphaGo的思路和招法,李世石在首爾也試圖打敗AlphaGo,非常期待明天的第二局比賽。AI對我們的影響越來越大,比如用拍照的方式來幫助翻譯,用很小的團隊非常少的投入就能實現。
谷歌Tensor Flow已運行兩年多,第二代Tensor上周發佈,第二代TPU是針對訓練及推理設計的,比市面上最好的32臺GPU快4倍。TPU艙室有64臺第二臺TPU,每秒11.5千萬億次浮點運算,內存四百萬兆字節,二維環狀多跳網絡。谷歌向致力於研究開放式機器學習的頂尖研究人員免費開放1000臺配有TPU的雲虛擬機。
自動化機器學習(學會學習):機器學習模型的設計極其復雜,學會學習,我們能自動解決很多學習問題嗎?
現狀:模型=數據+計算+機器學習技能(有限供應量阻礙使用量的增長)
方案:模型=數據+100×計算
研究模型,學習優化方程,學習探索方向。
關於智能搜索,未來可查詢的問題示例:“哪副眼部圖像顯示糖尿病性視網膜病變癥狀”“用西班牙語描述這段視頻”“請從廚房為我倒一杯茶”“幫我找出與機器強化學習相關文件並用中文總結一下”。
人工智能有很多可能性,正在產生巨大影響,並且有非常廣泛的發展可能。
傑夫迪恩:當我們面對大量照片時,可以自動識別添加標簽分類;目前谷歌20%的移動搜索是通過語音完成的;Inbox智能回復中12%的回復是用手機發送的。谷歌圖像處理:降噪、消除雨點、欄桿,藝術化處理,明暗識別等等。也應用在谷歌助手裡。端到端的信號+人類模仿。使用機器學習改善健康醫療水平。
deepmind團隊預測,master版本比李世石版本提升瞭三子
傑夫迪恩:人工智能如何工作。
人工智能創造出智慧的電腦,機器學習創造出會學習的電腦,從而完成偉大的壯舉。神經網絡是通過不斷輸入像素等內容參數,根據結果不斷來調優,來達到準確的輸出結果,培訓出模型,直到自己能找到準確答案。包括通過像素識別內容、音頻轉換文字、翻譯、甚至看圖來作文。
2011年,神經網絡識別圖像的錯誤率是26%,而人類是5%。到2016年,神經網絡的錯誤率已經達到3%,打敗瞭人類,隻用瞭5年的時間。
在學習英語到韓語的翻譯時,也同時學習英語到日語的翻譯,從而達到更好效果,也自動學會日韓之間的翻譯。現在我們有強大計算能力、大量訓練數據等從而實現目標。即時相機翻譯如何運作?首先拍攝圖片找出每個字母再翻譯。
大衛席爾瓦:介紹AlphaGo算法。
為什麼選擇圍棋?它是人類最古老、研究最深入的遊戲;是構建理解運算的最佳試驗臺;人工智能面臨巨大挑戰:遊戲大至可以進行窮舉搜索。
我們利用卷積神經網絡來實現,原版AlphaGo有12層,Master有40層。我們用策略網絡和價值網絡來解決問題,策略網絡進行落子選點,價值網絡進行評估。通過人類棋譜來進行監督式學習,調整參數來達到理想效果,通過策略網絡來進行強化學習,自我對局成千上萬盤,通過價值網絡來評估,預測每一步棋後終局的輸贏。
如果用窮舉搜索,范圍實在太大,我們需要簡化減少搜索量,通過策略網絡來聚焦幾個有可能的選項,用價值網絡來降低搜索深度。就是AlphaGo的樹搜索,從樹根開始,一個搜索基礎上加上一個新搜索,最終把結果提交給樹頂。這個過程會重復成百上千次,直到發現哪一步贏棋概率最高。AlphaGo Lee在谷歌雲上有50 TPUs在運作,搜索50個棋步為10000個位置/秒,於2016年在首爾大敗李世石。
AlphaGo並不是比深藍更聰明,而是用價值策略網絡減少瞭搜索范圍。AlphaGo Master版本更強大,在單個TPU機器上進行遊戲,相當於AlphaGo成為自己的老師,從自己的搜索裡學習,使用最好的來自AlphaGo自己的數據;更強大的策略/價值網絡。TPU在谷歌雲上可供大傢使用。
AlphaGo Master強化學習如何實現:AlphaGo與自己對弈,強化學習,自己吸取經驗來改進。策略網絡P以預測AlphaGo的移動,價值網絡V以預測獲勝者。比如通過復盤發現那一步是勝招,是第10步,我們通過這樣的方式反復迭代,新策略和價值網絡用於AlphaGo的下一個迭代中,新版AlphaGo可以得到更好結果和數據,達成良性循環。
AlphaGo的表現如何呢?以圍棋等級分來看,以前ZEN、CrazyStone軟件達到約2000分,樊麾版AlphaGo達到3000分,李世石版AlphaGo上漲3子,達到3500分,AlphaGo Master又漲3子,達到4500分以上。
DeepMind深度強化學習的目標是:超越AlphaGo。比如在3D射擊遊戲中,深度強化學習完全通過收到的像素來自我推理學習,達到人類的能力。通過不斷學習應對未來的挑戰。
去年的AlphaGo 與此次AlphaGo 不同之處。
未來能看到人機結合的巨大力量,1+1 2,在AI支持下人類能變得更加強大,有點像哈勃望遠鏡探索宇宙,人工智能讓我們更好瞭解世界,為人類所用的好工具,在科學、醫學等領域幫助人類進步。我們尋求最優,探尋距離最優還有多遠,怎樣才是完美的棋局;3000年對弈都不足以找到最佳棋局;AlphaGo讓我們可以探尋這些有趣奧秘;無數其他領域也將遭遇“組合轟炸”;強人工智能是我們研究和探尋宇宙的終極工具。
在科學研究、新藥研制等領域,不僅在玩遊戲,也要在現實生活中應用,在數據中心優化方面,我們能節省谷歌中心40%電能。元解決方案:信息過載和系統冗雜是巨大挑戰;開發人工智能技術可能是這些問題的元解決方案;目標:實現“人工智能科學傢”或“人工智能輔助科學”;和所有強大的新技術一樣,在倫理和責任約束中造福人類。我對自己大腦也非常感興趣,包括如何運作、做夢等等,希望人工智能幫助我們更好瞭解自己。
哈薩比斯:李世石表示人機大戰給瞭圍棋新啟發,這令人歡欣鼓舞。關於直覺,就是通過體驗直接獲得初步感知,但無法言傳、表達出來,可通過行為確認其存在和正誤。而創造力是通過組合已有知識產生新穎獨特想法的能力,AlphaGo顯然已在圍棋上展現出瞭創造力。我們希望打造完美的AlphaGo。在首爾的比賽顯示AlphaGo還有不足,我們希望彌補他的空白,在網上以Master的名字來做測試,獲得60比0的佳績,棋手們獲得很多啟發。展現出很多新招法,比如點三三、序盤連續爬二路,等等。柯潔表示人與AI應攜手並進,古力也表示人與AI合作的時代大幕已拉開。卡斯帕羅夫也在書中說,深藍已結束,而AlphaGo才剛開始。AlphaGo有點像吳清源在三四十年代一樣帶來圍棋新時代。棋類程序講戰術,而AlphaGo講戰略。
哈薩比斯回顧去年與李世石的比賽
戴密斯哈薩比斯:今天我將介紹如何賦予機器創造力,以及DeepMind在做什麼。DeepMind2010年創立於倫敦,2014年加入Google,目前進行人工智能“阿波羅計劃”,發現研發科學新方式。我們第一步是要攻克智能。打造通用型學習機器,非程序預設——自主學習原始材料;通用:同一系統可執行多種任務。用原先的經驗應對新挑戰。核心技術是深度學習和強化學習。
通用型的強人工智能與弱人工智能不一樣。最好的例子就是深藍擊敗卡斯帕羅夫,智能之處是用既定代碼輸入深藍,還不算強化學習。
強化學習框架:智能體通過觀察建模來瞭解環境,從而做決定計劃行動,應對挑戰,強人工智能就能實現,從而幫助到人。
雅達利智能體:包括百餘款八十年代的八位雅達利遊戲。通過深度強化學習,在進行300次遊戲後發現捷徑明顯變得更加善於遊戲,獲得更好策略,這是三年前的情況。
這兩年AlphaGo團隊專註於圍棋項目,因圍棋復雜程度讓窮舉搜索都難以解決:“不可能”寫出評估程度已決定誰贏;搜索空間太過龐大。
圍棋與國際象棋相比,不光是簡單計算,更需要直覺。比如問國象棋手,他會說自己有明確的逐步計劃。而圍棋手可能不僅靠計算,而是靠直覺;圍棋中沒有等級概念,所有棋子都一樣;棋盤是空的,要在心中不斷摸索預測未來,圍棋是建築遊戲,因此需要盤算未來;小小一子可撼全局,牽一發而動全身;“妙手”如受天啟,玄妙深奧,好像天賦靈感。
如何才能化繁為簡,是通過兩種網絡來實現:策略和估值網絡。我們在《自然》雜志發表論文,很多公司也隨之作出瞭很不錯的人工智能圍棋程序。去年AlphaGo與李世石的人機大戰令韓國萬人空巷,AlphaGo最終獲勝,這一刻等瞭十年,可以說是十年磨一劍。在第二局中,AlphaGo第37步棋是我最喜歡的,讓世人驚嘆,他走出五路尖沖,是讓人難以想象的。如果在三路是重視實地,在第四路下棋更重視中央,而在第五路下棋則很少,似乎有些落空的感覺,自古人類都低估瞭在五路下棋的價值。而AlphaGo左下早早的兩顆黑子在50步後發揮出瞭作用。而李世石在第四局走出的那一手也顯示出他的天才,那次人機大戰有2.8億觀眾、3.5萬篇報道、棋盤銷量增長10倍。
上臺前的哈薩比斯,今天他會和大傢分享些什麼呢?
參加論壇的樊麾和黃博士
- 台中通馬桶價錢 台中抽化糞池廠商哪裡找?推薦台中抽化糞池優質店家
- 台中市抽化糞池 台中水肥清運廠商該如何找呢?專家分享台中水肥清運廠商@E@
- 台中清化糞池 社區公寓大廈抽肥該找哪個店家呢?社區公寓大廈抽肥就找台中抽水肥專業網
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
文章標籤
全站熱搜
留言列表