揭秘AlphaGo背后團隊:人工智能的下一個目標是什么?
來源: 一財網(wǎng)作者: 一財網(wǎng)
攻克圍棋,僅僅是AlphaGo背后Deepmind團隊的第一步。
近日,Deepmind創(chuàng)始人Demis Hassabis在接受The Verge采訪時透露, AlphaGo僅僅是谷歌人工智能項目的一個分支。在未來,Deepmind主要目的是“用人工智能解決一切問題”,并將進一步探索人工智能在醫(yī)療、機器人以及手機等多個領域的應用。
回溯Demis Hassabis的成功之路,從一個獲得過5次智力奧林匹克冠軍的國際象棋神童,到兩科優(yōu)等成績獲得劍橋大學計算機科學學位的青少年,再到創(chuàng)造了第一款包含人工智能的視頻游戲《主題公園》并創(chuàng)立了開創(chuàng)性的視頻游戲公司Elixir1,之后離開游戲產業(yè)深造神經(jīng)科學的PhD學位后于2010年創(chuàng)立Deepmind團隊,你會發(fā)現(xiàn)他的經(jīng)歷十分與眾不同。
Hassabis接受The Verge采訪時正值AlphaGo首勝李世石九段的次日清早,如果說這個時候他把來自媒體的追問拋到九霄云外似乎也無可厚非。然而他卻依舊熱情友好,當Google方面的代表告訴Hassabis一夕之間有超過3300篇韓國媒體關于他的采訪時,Hassabis表示出了明顯的詫異:“這真是難以置信,不過看到一個高深莫測的東西在短時間內變得如此受歡迎,還是一件有趣的事情。”
圍棋將是永恒的圣杯
據(jù)Hassabis稱:“圍棋一直位于完美信息游戲的頂峰之處,在可能性方面圍棋比國際象棋復雜得多,所以,尤其是在深藍之后,圍棋對于人工智能來說意味著可望而不可及的圣杯。盡管我們做出了很多的努力,但仍舊沒有特別深入的領悟圍棋。蒙特卡羅樹搜索可以說是十年前的一項重大革新,但是我認為對于AlphaGo的研發(fā)更為重要的部分在于我們引入了深度神經(jīng)網(wǎng)使得人工智能擁有了所謂的直覺方面的判斷力。可以說好的直覺是令頂尖棋手出類拔萃的關鍵原因,在昨天的比賽的實時解說中,當我看到麥克雷蒙九段在計算結果方面表示很難判斷的時候,再次感到寫出一套圍棋價值判斷的程序極其困難。
此外,對于AlphaGo在實戰(zhàn)過程中下出的一些出其不意的招數(shù),Hassabis表示十分震驚:“我相信李世石也會是同樣的感覺,從他的面部表情上面可以觀察出來,當AlphaGo向左進擊李世石的領域時,我承認這的確出人意料?!蓖瑫r他也認為,AlphaGo的下法極具進攻性,在某種程度上來說,AlphaGo在用李世石的長項來進行對抗。Hassabis說:“李世石以奇招頻出和善于把控局勢聞名,可以說AlphaGo在第一場比賽中下出了我們想要看到的局面,在開始的時候,它只是在整個棋盤上進行布局并沒有實質地占領某塊區(qū)域。傳統(tǒng)的圍棋程序之所以具有明顯的短板,是因為它們精于計算卻缺乏一種大局觀?!?/span>
為何AlphaGo的勝利意義重大
舉辦這場比賽的初衷在于評估AlphaGo 的能力,談及從AlphaGo的勝利中學到了什么以及未來它的發(fā)展方向,Hassabis表示:“通過比賽我們意識到我們目前所處的環(huán)節(jié)比之前預計的更加先進。對于完美信息游戲,圍棋一直位于金字塔尖,還有許多頂級的圍棋高手等待對決。此外,還有很多其他的游戲,比如說無限制撲克,因為是不完美信息游戲,因此多人游戲也是一個挑戰(zhàn)。顯而易見所有人類比機器玩兒的好的電子游戲也可以被考慮其中,比如說《星際爭霸》在韓國也是非常受歡迎的。在信息不完美世界里,策略游戲對決策能力有極高的要求,因為能夠被看到的僅僅是全局的一部分。而在圍棋之中全盤情況都是可視的,這點對于電腦來說會使游戲略微容易一些?!?/span>
盡管用人工智能進行游戲對戰(zhàn)刺激有趣,但是Deepmind團隊還是希望將人工智能用于更多主流的項目當中。Hassabis表示他本人對游戲十分感興趣,也許是曾經(jīng)寫過游戲,但是目前來說,游戲僅僅是提供測試平臺用來測試我們的算法并且評估它們的等級的一個行之有效的辦法。而Deepmind的終極目標在于用人工智能解決真實世界中的棘手問題。
談及自己過去從事游戲行業(yè)的經(jīng)歷對現(xiàn)在有何影響時,Hassabis說:“可以說創(chuàng)立Deepmind一直以來是我的最終目的,我用了近20年籌劃這個事情,如果你從一個最終我將要從事人工智能研究的角度審視我的經(jīng)歷,你會發(fā)現(xiàn)我的每一步選擇都是朝向人工智能的,熟悉我的Bullfrog員工都知道,我寫的所有游戲的核心都是與人工智能相關的。在16歲的時候寫《主題公園》游戲的時候我第一次意識到如果我們全力以赴進行研究,人工智能的前景不可估量。這款游戲十分暢銷,說明玩家享受其中,因為人工智能十分貼合玩家的心意。因此我繼續(xù)在游戲領域進行拓展,然而在2000年的時候我感覺到我們已經(jīng)在’從后門偷偷逼近‘人工智能研究的路上走到了盡頭,因為不管怎么樣你的最終目標都只是做出一款游戲,所以我轉而去學習神經(jīng)科學,以期在人工智能領域有所進展?!?/span>
Hassabis認為人工智能在90年代最直觀的應用即是體現(xiàn)在游戲行業(yè),那時,學術界的研究沒有什么動靜,一些諸如增強學習、深度學習、神經(jīng)網(wǎng)絡等新技術都沒有得到應用與推廣,所以游戲成為人工智能最好的應用領域,當然那時的人工智能與現(xiàn)在大相徑庭,當時的人工智能更像是較為復雜的有限狀態(tài)機(FSM),游戲Black &White中應用到了增強學習技術,到目前為止我仍舊認為這是在游戲中應用最復雜的案例。然而到了2004年左右,游戲行業(yè)發(fā)生了很大的變化,不再像90年代那樣只要你有一個不錯的點子就可以做一款游戲,游戲行業(yè)變得更加注重畫面感,并且官方授權也變得十分重要,像FIFA系列游戲就是一個很好的例子。所以我認為做游戲不再像以前那樣有趣了,并且我已經(jīng)在游戲領域積蓄了創(chuàng)立Deepmind所需的信息與經(jīng)驗,這個時候神經(jīng)科學引起了我的興趣,我很想從明白大腦解決問題的過程中獲得靈感,所以讀一個神經(jīng)科學的PhD再合適不過了?!?/span>
人工智能如何改變醫(yī)療領
人工智能的主要應用將會在醫(yī)療、智能手機助手、機器人科學領域,在醫(yī)療方面,目前認知計算系統(tǒng)IBM Watson已經(jīng)著手進行癌癥診斷的項目,據(jù)此,Deepmind表示幾周之前已經(jīng)開始了和NHS(英國國家醫(yī)療服務體系)的合作,構建一個可以應用機器學習智能的平臺。Hassabis認為IBM Watson所做的工作與Deepmind團隊的工作有所區(qū)別,癌癥篩查更像是一個專家系統(tǒng),是另一種形式的人工智能,這類人工智能所能做到的是進行圖像方面的醫(yī)學診斷,自我量化然后進行重要特征的橫向比對以及大量的篩查,從而指導人們擁有更健康的生活方式,我認為把增強學習技術用于這個領域較為適宜。
對于與NHS的合作,Deepmind推出了一款并未有用到AI或是機器學習的應用程序,原因在于NHS軟件自身來看較為落后,它們并不是移動端的,完全不適用于目前消費者的使用習慣,并且對于醫(yī)生和護士來說這個軟件十分低效。所以Deepmind首先會改善可視化與基礎化信息,借此看清真正的需求,繼而將更加熟練的機器運用其中。
未來核心應用領域
在第一天發(fā)布會的演講中,Hassabis使用了電影《她》中的海報作為講解的背景,對此他解釋道:“關于智能手機助手的樣子,《她》是較為盛行的主流觀點,我的看法是應該讓智能手機助手變得更加‘人性化’,使它能夠對你的需求有更加深刻的理解。而目前大部分這樣的系統(tǒng)都極為脆弱,一旦偏離了預先編程輸入的模版,它們就會變得毫無用處。”
正如Hassabis所言,目前基本所有的智能手機助手都屬于特殊案例和預編程的,這意味著它們很脆弱,只能做預編程寫好的事。然而真實的世界非?;靵y,用戶們也會在你無法提前知曉的情況下,做著不可預知的事情。所以DeepMind 的信念是:通往人工智能的唯一道路,是從地基開始打起,而且變得通用。這也是最根本的原則之一。
針對這點該如何改進,Hassabis的看法是:”由于智能手機的輸入十分多變,所以或許得輸入有’上萬噸’的數(shù)據(jù),才可以從中學習到很多東西。根據(jù)AlphaGo 的算法,我們打算在未來幾個月嘗試的是,擺脫監(jiān)督式學習的出發(fā)點,讓它完全自我發(fā)揮,從一無所有的狀態(tài)開始。它會需要更長的時間,因為當你采用隨機方法的時候,其中的審查和錯誤會需要更多的時間訓練,也許是幾個月。但是,我們認為有這個可能性,讓它從純粹的學習中起步。“對于何時才能看到人工智能給市場帶來顯著性差異,Hassabis給出的答案是:”我認為在未來的兩到三年會開始看到改善。我的意思是,這些改善在開始的時候是非常微小的,只有很小的部分會工作的更好。也許在未來的4 到5 年,甚至5 年更多,你可以看到智能手機在功能上大的變化。“
為何選擇Google ?
事實上,AlphaGo 在比賽中并沒有使用那么多硬件,然而Deepmind團隊需要大量的硬件來訓練它,做各種不同的版本,并讓他們在云端互相比賽。這需要相當多的硬件才能高效完成,所以如果沒有這些資源,在這段時間內根本無法完成。這也是Deepmind選擇與Google合作的原因之一。
關于是否期待被納入Google商業(yè)模式與產品路線圖中,Hassabis認為:“在如何最優(yōu)化研究進展方面,我們有很強的主導權。這是我們的使命,也是為什么我們加入了Google,這樣我們可以給研究進行渦輪增壓。這是發(fā)生在過去幾年的事情。當然,我們實際上也致力于很多Google 內部的產品,但是他們是非常早期的階段,所以還沒準備好公布。當然我認為智能手機助手是非常核心的,我認為Sundar Pichai 已經(jīng)對此談了很多,這是Google 未來的核心?!?/span>
對于與Google Brain是否有合作,Hassabis表示:“其實我們是非常互補的。我們每周都有交談。Google Brain 主要致力于深度學習,他們也有非常卓越的工程師Jeff Dean,所以他們已經(jīng)鋪開到公司的各個角落,這也是為什么我們發(fā)明出了令人驚喜的Google 圖片搜索。他們正在做著現(xiàn)象級的工作。另外,他們的團隊在山景城,所以他們離產品團隊更近,他們的研究周期也更像12 到18 個月。而我們有更多算法開發(fā)的工作,我們傾向于為需要兩三年研究的事情做研究,而且不需要在開始的時候就有直接的產品焦點。”
關注未來科學
關于機器人科學目前的發(fā)展狀況,Hassabis認為它們或許有漂亮的軀干,但是依然缺乏智慧的“大腦”,與智能手機助手目前的狀況相似,機器人目前似乎只能對預先進行編程的情況作出反應,一旦處于狀況之外,機器人無疑會無所適從。因此如何通過機器學習強化機器人的能力十分重要。
對于科學習的機器人,Hassabis舉出了一些直接使用的案例:“顯然,自動駕駛汽車是一種機器人,但目前來說還是狹義的人工智能,雖然他們使用了計算機視覺里面一些可學習的人工智能——特斯拉采用了一種基于深度學習的標準、現(xiàn)場的計算機視覺方案。我相信日本在老年護理機器人、家庭清潔機器人上面有很多思考,我認為這對社會會非常有用。特別是在一個人口老齡化的社會里,我認為是一個非常緊迫的問題?!?/span>
對人類、機器人和人工智能在未來的交互,Hassabis的期望是:“我自己對機器人沒多少思考。我自己對人工智能的使用感到興奮的領域是科學,能夠推動它更快的發(fā)展。我想看到人工智能未來能夠輔助科學,如果有一個人工智能研究助手,它可以做很多乏味的工作,閱讀有趣的論文,從海量的數(shù)據(jù)中找到結構,并把它們呈現(xiàn)到人類專家和科學家面前,以實現(xiàn)更快的技術突破。我?guī)讉€月前在歐洲核子研究中心做演講,很顯然它們創(chuàng)造出比地球上任何地方都多的數(shù)據(jù),我們都知道在它們海量的硬盤中,可能會有某個新的粒子發(fā)現(xiàn),但沒有人能抽出時間做這件事情,因為這里的數(shù)據(jù)量的確太過龐大。所以我覺得,如果有一天人工智能參與尋找到一個新的粒子,那么是一件非??岬氖?。”