我愛學(xué)習(xí)網(wǎng)-上傳
當(dāng)前位置: 主頁 > IT資訊 >

AI不可能這么傻:深度學(xué)習(xí)的致命弱點(diǎn)

時(shí)間:2019-12-19 22:27來源:我愛學(xué)習(xí)網(wǎng) 作者:apple 點(diǎn)擊:

一輛自動(dòng)駕駛汽車正在靠近一個(gè)停車讓行標(biāo)志,它非但沒有停下,反而加速?zèng)_入了繁忙的十字路口。后續(xù)的事故調(diào)查發(fā)現(xiàn),停車讓行的標(biāo)志上貼了幾張方形標(biāo)簽,正是這些標(biāo)簽讓汽車的人工智能(AI)系統(tǒng)將停車標(biāo)志錯(cuò)誤識(shí)別為“限速45”。

 

 

這一場(chǎng)景沒有真實(shí)發(fā)生,但AI被蓄意破壞和惡意攻擊的危險(xiǎn)卻一直存在

 

研究人員已經(jīng)證實(shí),通過在特定位置放置貼紙,就能讓AI誤讀停車標(biāo)志1;如果將特定印刷圖案貼在眼鏡或帽子上,就能騙過人臉識(shí)別系統(tǒng);不僅如此,研究人員還嘗試在音頻中加入一定模式的白噪聲,成功讓語音識(shí)別系統(tǒng)產(chǎn)生了幻聽。

 

上面只是簡單幾例,說明要破壞AI的先進(jìn)模式識(shí)別技術(shù)有多么容易。這種模式識(shí)別技術(shù)也被稱為深度神經(jīng)網(wǎng)絡(luò)(deep neural networks,DNN),它對(duì)圖像、語音和消費(fèi)者數(shù)據(jù)等各種類型的輸入具有強(qiáng)大的分類能力。從自動(dòng)電話系統(tǒng)到流媒體網(wǎng)站的用戶推薦,深度神經(jīng)網(wǎng)絡(luò)早已融入了我們的日常生活。然而,只要對(duì)輸入做一些微小改變,即使變化小到人類無法辨識(shí),也能使最先進(jìn)的AI系統(tǒng)懵圈。

 

加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)博士生Dan Hendrycks表示,對(duì)于一項(xiàng)還不完美的技術(shù)來說,這些問題比特異性怪異模式更值得警惕。和許多研究人員一樣,他認(rèn)為這種問題凸顯出了深度神經(jīng)網(wǎng)絡(luò)根本上的脆弱性——縱使在擅長的工作上表現(xiàn)出色,一旦進(jìn)入陌生領(lǐng)域,它們將以無法預(yù)測(cè)的方式崩潰。

 

 

而這絕不是小問題。隨著深度學(xué)習(xí)不斷從實(shí)驗(yàn)室走向真實(shí)世界,從自動(dòng)駕駛汽車到罪犯搜索再到疾病診斷無處不在。但正如今年的一項(xiàng)研究指出2,只要在醫(yī)學(xué)掃描影像中惡意增加幾個(gè)像素,深度神經(jīng)網(wǎng)絡(luò)就會(huì)將其誤診為癌癥。此外,黑客還能利用這些弱點(diǎn)劫持在線的AI系統(tǒng),讓它執(zhí)行自己的算法3。

 

在搞清楚深度神經(jīng)網(wǎng)絡(luò)為什么會(huì)失敗的過程中,研究人員已經(jīng)找到了很多原因。谷歌AI工程師François Chollet稱,“對(duì)于深度神經(jīng)網(wǎng)絡(luò)的這種根本脆弱性,目前沒有修復(fù)方法”。想要彌補(bǔ)這些缺陷,他與其他人都認(rèn)為需要用額外的能力來“增強(qiáng)”善于模式匹配的深度神經(jīng)網(wǎng)絡(luò),比如讓AI自主探索世界、自主編寫代碼并保留記憶。一些專家認(rèn)為,這樣的系統(tǒng)將塑造今后10年的AI研究。

 

實(shí)踐的檢驗(yàn) 

 

2011年,谷歌發(fā)布的一套系統(tǒng)可以識(shí)別YouTube視頻中的貓,隨之掀起了一股深度神經(jīng)網(wǎng)絡(luò)分類系統(tǒng)的熱潮懷俄明大學(xué)的Jeff Clune也是Uber舊金山AI實(shí)驗(yàn)室的高級(jí)研究經(jīng)理,據(jù)他回憶,“那時(shí)候每個(gè)人都在說,‘太厲害了,計(jì)算機(jī)終于可以理解世界了’”。

 

AI研究人員明白,深度神經(jīng)網(wǎng)絡(luò)并沒有真正地理解世界。通過對(duì)大腦結(jié)構(gòu)的粗略建模,大量的數(shù)字神經(jīng)元被部署在多層結(jié)構(gòu),這構(gòu)成了深度神經(jīng)網(wǎng)絡(luò)的基本軟件結(jié)構(gòu),其中每個(gè)神經(jīng)元都與前后層的神經(jīng)元相連。

 

深度學(xué)習(xí)網(wǎng)絡(luò)的基本概念是,底層輸入的圖像或像素等原始特征會(huì)激發(fā)這些神經(jīng)元,通過簡單的數(shù)學(xué)規(guī)則產(chǎn)生信號(hào)并傳遞給更高層級(jí)。訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)需要使用大量樣本,不斷調(diào)節(jié)神經(jīng)元之間的連接方式,直到頂層神經(jīng)元輸出期望的答案——比如將獅子的圖片識(shí)別成獅子,即使之前從未見過這張圖片。

 

第一次大型實(shí)踐檢驗(yàn)發(fā)生在2013年。谷歌研究員Christian Szegedy和同事發(fā)表了一篇題為《論神經(jīng)網(wǎng)絡(luò)的有趣特性》的預(yù)印本論文4。研究人員只改變了少量像素,就讓深度神經(jīng)網(wǎng)絡(luò)得出了完全不同的結(jié)果,比如把獅子識(shí)別成圖書館。團(tuán)隊(duì)把這種更改過的圖像稱為“對(duì)抗樣本”。

 

 

一年后,Clune和他當(dāng)時(shí)帶的博士生Anh Nguyen與康奈爾大學(xué)的Jason Yosinki合作,共同演示了什么叫做“睜眼說瞎話”,比如讓深度神經(jīng)網(wǎng)絡(luò)將曲線條紋識(shí)別成企鵝5。深度學(xué)習(xí)領(lǐng)域的先驅(qū)、來自加拿大蒙特利爾大學(xué)的Yoshua Bengio說:“和機(jī)器學(xué)習(xí)打過交道的人都知道它們經(jīng)常會(huì)犯低級(jí)錯(cuò)誤。但這種錯(cuò)誤是研究人員意料之外的,我們無法想象這種錯(cuò)誤會(huì)發(fā)生。”

 

新的錯(cuò)誤紛至沓來。目前就職于美國奧本大學(xué)的Nguyen發(fā)現(xiàn),只要將圖像中的物體稍微轉(zhuǎn)個(gè)方向,就足以把一些最好的圖像分類器搞得團(tuán)團(tuán)轉(zhuǎn)6。今年,Hendrycks和同事還報(bào)道稱,即使是未經(jīng)更改的自然圖像也能讓先進(jìn)的分類器給出不可預(yù)測(cè)的錯(cuò)誤答案,例如將蘑菇識(shí)別成了扭結(jié)餅,將蜻蜓識(shí)別成了井蓋7。

 

 

這一問題不僅出現(xiàn)在物體識(shí)別技術(shù)上,任何利用深度神經(jīng)網(wǎng)絡(luò)為輸入(如語音)進(jìn)行分類的AI都很容易受騙上當(dāng)。會(huì)玩游戲的AI也很容易遭到暗算。2017年,加州大學(xué)伯克利分校的計(jì)算機(jī)科學(xué)博士生Sandy Huang和同事讓經(jīng)過訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)通過“強(qiáng)化學(xué)習(xí)”的過程打一個(gè)名為Atari的電子游戲8。研究人員會(huì)先給AI一個(gè)目標(biāo),再看它對(duì)一系列輸入的響應(yīng),通過試錯(cuò)的方式讓它達(dá)到目標(biāo)。

 

這種技術(shù)成就了具有超人能力的游戲AI,包括著名的AlphaZero和撲克機(jī)器人Pluribus。即便如此,Huang的團(tuán)隊(duì)還是可以通過在屏幕上添加一兩個(gè)隨機(jī)像素,讓AI輸?shù)粽麍?chǎng)比賽。

 

今年早些時(shí)候,加州大學(xué)伯克利分校的AI博士生Adam Gleave和同事的研究表明,將一個(gè)主體引入一個(gè)AI環(huán)境,就能讓其做出混淆視聽的“對(duì)抗策略”9。舉例來說,一個(gè)AI足球運(yùn)動(dòng)員的訓(xùn)練目標(biāo)是讓球越過守門員,但在仿真環(huán)境中,當(dāng)守門員表現(xiàn)出無法預(yù)料的行為時(shí),如倒在地上,AI足球運(yùn)動(dòng)員也會(huì)失去進(jìn)球的能力。

 

一個(gè)AI足球運(yùn)動(dòng)員在模擬的點(diǎn)球大戰(zhàn)中被AI守門員的“對(duì)抗策略”(倒在地上)迷惑(右)。

 

看透深度神經(jīng)網(wǎng)絡(luò)的弱點(diǎn)所在,甚至能讓黑客掌控強(qiáng)大的AI。去年谷歌的一個(gè)團(tuán)隊(duì)就展示了他們不僅可以利用對(duì)抗樣本讓深度神經(jīng)網(wǎng)絡(luò)犯下特定錯(cuò)誤,還能對(duì)它進(jìn)行重新編程,讓經(jīng)過訓(xùn)練的AI去執(zhí)行其他不相關(guān)的任務(wù)3。

 

原則上,許多學(xué)習(xí)語言的神經(jīng)網(wǎng)絡(luò)可以用于編碼任何其他的計(jì)算機(jī)程序。Clune表示:“理論上你可以將聊天機(jī)器人的程序轉(zhuǎn)換成任何你想要的程序,而這只是震驚的開始。”他認(rèn)為在不遠(yuǎn)的未來,黑客會(huì)劫持云端的神經(jīng)網(wǎng)絡(luò),運(yùn)行自己的垃圾郵件算法。

 

對(duì)于加州大學(xué)伯克利分校的計(jì)算機(jī)科學(xué)家Dawn Song來說,深度神經(jīng)網(wǎng)絡(luò)就像活靶子。她說:“攻擊系統(tǒng)的方法太多了,防御非常非常困難。”

 

越強(qiáng)大越脆弱

 

深度神經(jīng)網(wǎng)絡(luò)的強(qiáng)大之處在于它們的多層結(jié)構(gòu),可以從一個(gè)輸入的不同特征上提取模式來進(jìn)行分類。對(duì)于一個(gè)被訓(xùn)練用于識(shí)別飛機(jī)的AI來說,色彩、紋理和背景一類的特征對(duì)它們而言,就像我們眼中的顯著特征——機(jī)翼一樣。這也意味著輸入的微小改變會(huì)讓AI的預(yù)測(cè)結(jié)果大相徑庭。

 

一個(gè)解決辦法是給AI更多數(shù)據(jù),讓AI反復(fù)暴露在有問題的例子下,不斷地糾正它的錯(cuò)誤。在這種“對(duì)抗訓(xùn)練”的方式下,其中一個(gè)網(wǎng)絡(luò)會(huì)學(xué)習(xí)識(shí)別物體,另一個(gè)網(wǎng)絡(luò)則嘗試改變前一個(gè)網(wǎng)絡(luò)的輸入來使它出錯(cuò)。這樣就能把對(duì)抗樣本變成深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)的一部分。

 

Hendrycks和同事建議用大規(guī)模對(duì)抗樣本來測(cè)試深度神經(jīng)網(wǎng)絡(luò)的表現(xiàn),量化深度神經(jīng)網(wǎng)絡(luò)抵抗錯(cuò)誤的魯棒性。但他們也表示,在訓(xùn)練網(wǎng)絡(luò)抵抗某種攻擊的同時(shí)也會(huì)弱化網(wǎng)絡(luò)對(duì)于其他攻擊的抵抗力。谷歌DeepMind倫敦辦公室的一個(gè)研究團(tuán)隊(duì)在Pushmeet Kohli的領(lǐng)導(dǎo)下嘗試為深度神經(jīng)網(wǎng)絡(luò)“接種”抵抗出錯(cuò)的“疫苗”。

 

很多對(duì)抗攻擊都是通過對(duì)輸入進(jìn)行微調(diào)來讓深度神經(jīng)網(wǎng)絡(luò)產(chǎn)生誤分類的,例如稍微改變圖像像素的顏色,一直到能讓深度神經(jīng)網(wǎng)絡(luò)出錯(cuò)為止。Kohli團(tuán)隊(duì)認(rèn)為,一個(gè)魯棒的深度神經(jīng)網(wǎng)絡(luò)其輸出不會(huì)因?yàn)檩斎氲奈⑿∽兓淖儯@一特性可用數(shù)學(xué)的方式整合進(jìn)整個(gè)網(wǎng)絡(luò),通過限制它學(xué)習(xí)的方式來實(shí)現(xiàn)。

 

但目前還沒有人能夠從整體上修復(fù)AI這一脆弱性的問題。Bengio說,問題的根源在于深度神經(jīng)網(wǎng)絡(luò)沒有一個(gè)好的模型來指導(dǎo)它們?nèi)绾螐臄?shù)據(jù)中挑選重要的部分。雖然AI會(huì)把修改后的獅子圖片看成圖書館,但人是不會(huì)看錯(cuò)的,因?yàn)槿祟惸X中對(duì)于獅子的概念是由耳朵、尾巴以及獅鬃等一系列高級(jí)特征構(gòu)成的,這讓人類能從一些低級(jí)屬性或次要細(xì)節(jié)中抽離出來。Bengio說:“我們的經(jīng)驗(yàn)告訴我們哪些特征才是重要的,而這來自于我們對(duì)世界結(jié)構(gòu)的深入理解。”

 

想要解決這一問題,一種嘗試是將深度神經(jīng)網(wǎng)絡(luò)和符號(hào)學(xué)AI相結(jié)合——符號(hào)學(xué)在機(jī)器學(xué)習(xí)之前曾經(jīng)統(tǒng)治AI領(lǐng)域。利用符號(hào)學(xué)AI,機(jī)器學(xué)習(xí)可以通過世界運(yùn)行的硬編碼規(guī)則來進(jìn)行推理,例如不同離散物體間的不同相互作用方式。

 

很多研究人員和紐約大學(xué)的心理學(xué)家Gary Marcus一樣,認(rèn)為混合AI是未來前進(jìn)的方向。Marcus一直是當(dāng)前深度學(xué)習(xí)方式的批評(píng)者,他說:“深度學(xué)習(xí)在短期內(nèi)的用場(chǎng)使得人們失去了長遠(yuǎn)的眼光。”今年5月,他在加州帕羅奧圖聯(lián)合創(chuàng)立了名為Robust AI的初創(chuàng)公司,致力于結(jié)合深度學(xué)習(xí)與基于規(guī)則的AI技術(shù)來開發(fā)機(jī)器人,這種機(jī)器人可以與人安全地協(xié)作。公司從事的具體業(yè)務(wù)目前還處于保密狀態(tài)。

 

即使能將規(guī)則嵌入深度神經(jīng)網(wǎng)絡(luò),它們的能力也無法超越其學(xué)習(xí)的數(shù)據(jù)。Bengio認(rèn)為AI智能體需要在更復(fù)雜的環(huán)境中進(jìn)行學(xué)習(xí)和自我探索。大多數(shù)計(jì)算機(jī)視覺系統(tǒng)都無法識(shí)別出一聽圓柱形的啤酒,因?yàn)樗鼈兪峭ㄟ^二維圖像訓(xùn)練的。這也是為何Nguyen和同事只消讓物體換一個(gè)角度,就能騙過深度神經(jīng)網(wǎng)絡(luò)了。而在三維環(huán)境中學(xué)習(xí),無論是真實(shí)環(huán)境還是模擬環(huán)境,都能幫助解決這一問題。

 

另一方面,AI學(xué)習(xí)的方式也需要改變。Bengio說:“學(xué)會(huì)因果推理需要讓主體在真實(shí)世界中進(jìn)行活動(dòng),讓他們自由實(shí)驗(yàn)和探索。”另一位深度學(xué)習(xí)先驅(qū)、來自瑞士Dalle Molle人工智能研究所的Jürgen Schmidhuber也抱有同樣的想法。

 

他認(rèn)為模式識(shí)別太強(qiáng)大了,強(qiáng)大到把阿里巴巴、騰訊、亞馬遜、臉書和谷歌送上了全球最值錢企業(yè)的寶座。但緊隨其后的將是更大的浪潮,這次浪潮將以機(jī)器為中心,這些機(jī)器不但可以操縱世界,還能用自己的行為創(chuàng)造它們自己的數(shù)據(jù)。

 

從某種意義上來說,利用強(qiáng)化學(xué)習(xí)稱霸電子游戲的AI已經(jīng)在人工環(huán)境中這么做了:通過不斷試錯(cuò),它們以被允許的方式操作屏幕上的像素直到目標(biāo)達(dá)成。不過,相較于目前用于訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的仿真環(huán)境或整理好的數(shù)據(jù)來說,現(xiàn)實(shí)環(huán)境的復(fù)雜程度更甚。

 

即興機(jī)器人

 

在加州大學(xué)伯克利分校的一間實(shí)驗(yàn)室里,一條機(jī)械臂正在翻找著什么。它撿起一個(gè)紅色的碗,并用碗把一個(gè)藍(lán)色的烤箱手套往右輕推了幾厘米。它扔掉了碗,撿起了一個(gè)空的塑料噴瓶,隨后又掂量了一番一本書的質(zhì)量和外形。在連續(xù)多天不休不眠的訓(xùn)練后,這個(gè)機(jī)器人開始熟悉這些陌生物品,以及怎么和它們“玩”。

 

這條機(jī)械臂利用深度學(xué)習(xí)教會(huì)自己如何使用工具。給它一堆物體,它會(huì)一個(gè)個(gè)撿起來,看看移動(dòng)它們或用一個(gè)物體碰觸另一個(gè)物體會(huì)發(fā)生什么。

 

 

 

 當(dāng)研究人員給機(jī)器人設(shè)定一個(gè)目標(biāo),例如給它呈現(xiàn)一張接近空托盤的圖片,并讓機(jī)器人整理托盤中的物品以匹配圖片中的狀態(tài),機(jī)器人就會(huì)開始自己的表演,利用沒有見過的物品來進(jìn)行操作,例如它會(huì)用一塊海綿將所有的東西掃下桌面。

 

它還會(huì)發(fā)現(xiàn)利用塑料水瓶推開物品比直接拾取這些物品來得更快。“與其他機(jī)器學(xué)習(xí)技術(shù)相比,它完成任務(wù)的通用性給我留下了十分深刻的印象。” 曾在伯克利實(shí)驗(yàn)室工作、目前在斯坦福大學(xué)繼續(xù)相關(guān)研究的Chelsea Finn說。

 

Finn認(rèn)為,這種學(xué)習(xí)方式增進(jìn)了AI對(duì)于物體和世界的普遍理解。如果你只在照片中見到過水瓶或者海綿,你也許可以在其他圖像中識(shí)別出它們,但你不知道它們到底是什么、有什么用。她說:“如果不能與世界進(jìn)行實(shí)際交互,你對(duì)世界的認(rèn)識(shí)就只能停留在粗淺的表面。”

 

但是,這種學(xué)習(xí)是一個(gè)緩慢的過程。在仿真環(huán)境中,AI能以光速遍歷樣本。2017年,DeepMind出品的自主學(xué)習(xí)游戲軟件AlphaZero被訓(xùn)練成了超人大師,僅僅一天就精通了從圍棋到國際象棋再到日本象棋的多個(gè)游戲。當(dāng)時(shí),對(duì)于每一項(xiàng)比賽,AI都在虛擬環(huán)境中進(jìn)行了超過2000萬次的訓(xùn)練。

 

AI機(jī)器人無法如此快速地學(xué)習(xí)。幾乎所有主流的深度學(xué)習(xí)方法都極度依賴大量的數(shù)據(jù),Ambidextrous(一家位于加利福尼亞伯克利的AI和機(jī)器人公司)的聯(lián)合創(chuàng)始人Jeff Mahler說道,"在單個(gè)機(jī)器人上收集幾千萬數(shù)據(jù)點(diǎn)將耗費(fèi)數(shù)年時(shí)間。”同時(shí),由于傳感器的標(biāo)定會(huì)隨時(shí)間變化,硬件也在老化,得到的數(shù)據(jù)也不一定可靠。

 

因此,大多數(shù)基于深度學(xué)習(xí)的機(jī)器人工作依然利用仿真環(huán)境來加速訓(xùn)練。“你能學(xué)習(xí)到的內(nèi)容取決于你構(gòu)建仿真環(huán)境的質(zhì)量。”來自佐治亞理工的機(jī)器人學(xué)博士生David Kent說。

 

仿真器不斷在改進(jìn),研究人員也越來越擅長于將虛擬環(huán)境中學(xué)習(xí)到的知識(shí)遷移到真實(shí)環(huán)境中去。不過仿真環(huán)境目前還無法與復(fù)雜的真實(shí)世界相媲美。

 

Finn認(rèn)為,利用機(jī)器人學(xué)習(xí)最終肯定比利用人工數(shù)據(jù)學(xué)習(xí)更具擴(kuò)展性。她的“工具使用”機(jī)器人在幾天內(nèi)學(xué)會(huì)了相對(duì)簡單的任務(wù)而無需密集的監(jiān)督。她說:“你只需要運(yùn)行機(jī)器人,一段時(shí)間檢查一次就好。”她期待未來有一天可以有很多機(jī)器人,給它們工具夜以繼日的學(xué)習(xí)。這不是沒有可能,畢竟這也是人類認(rèn)識(shí)世界的方式。Schmidhuber說:“嬰兒不是通過從Facebook上下載數(shù)據(jù)來學(xué)習(xí)的。”

 

嬰兒可以從很少的數(shù)據(jù)點(diǎn)中學(xué)會(huì)識(shí)別新樣本:即使他們從未見過長頸鹿,卻能在見過一兩次后認(rèn)出它們。嬰兒學(xué)習(xí)如此迅速的部分原因在于,它們還見過長頸鹿之外許多其他生物,所以對(duì)于物體的顯著特征也較為熟悉。

 

遷移學(xué)習(xí)為AI提供了類似的能力:其基本概念是將其他任務(wù)訓(xùn)練得到的知識(shí)進(jìn)行遷移。當(dāng)訓(xùn)練一個(gè)新的任務(wù)時(shí),通過復(fù)用部分或整體的預(yù)訓(xùn)練網(wǎng)絡(luò)來作為訓(xùn)練的起始點(diǎn),從而實(shí)現(xiàn)遷移學(xué)習(xí)。例如,對(duì)一個(gè)已經(jīng)能夠識(shí)別一種動(dòng)物的深度神經(jīng)網(wǎng)絡(luò)的一部分加以重復(fù)利用,比如那些能識(shí)別基本動(dòng)物體形的層,就能為學(xué)習(xí)識(shí)別長頸鹿的新網(wǎng)絡(luò)提供更多優(yōu)勢(shì)。

 

遷移學(xué)習(xí)的一種極端形式是僅僅通過幾個(gè)樣本甚至是一個(gè)樣本就訓(xùn)練出新的網(wǎng)絡(luò)。這種稱為少樣本學(xué)習(xí)或單樣本學(xué)習(xí)的方法極度依賴于預(yù)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)。

 

想象一下,你想要構(gòu)建一個(gè)能在刑事數(shù)據(jù)庫中識(shí)別罪犯的人臉識(shí)別系統(tǒng)。一個(gè)快捷方法是利用一個(gè)已經(jīng)看過數(shù)百萬張人臉(無需為新數(shù)據(jù)庫的人臉)的深度神經(jīng)網(wǎng)絡(luò),因?yàn)樗呀?jīng)很好地理解了人臉的顯著特征,如鼻子和下巴的形狀等。當(dāng)這個(gè)網(wǎng)絡(luò)掃描一張新的人臉時(shí),就能從圖片中精確提取有用的特征集,隨后再與罪犯數(shù)據(jù)庫中的圖像進(jìn)行相似度比對(duì),找到匹配度最高的對(duì)象。

 

擁有這樣的預(yù)訓(xùn)練記憶可以幫助AI在無需觀察大量模式的情況下識(shí)別新樣本,加速機(jī)器人的學(xué)習(xí)速度。但這樣的深度神經(jīng)網(wǎng)絡(luò)在面對(duì)與先前經(jīng)驗(yàn)相差太遠(yuǎn)的實(shí)例時(shí)也會(huì)陷入差錯(cuò)。目前還不清楚這樣的網(wǎng)絡(luò)有多強(qiáng)的通用性。

 

即便像DeepMind的AlphaZero這樣最為成功的AI,都只局限于非常狹窄的領(lǐng)域。AlphaZero的算法在訓(xùn)練后可以下圍棋或國際象棋,但卻無法同時(shí)下兩種棋。重新訓(xùn)練一個(gè)模型的連接和反應(yīng),讓它打贏國際象棋比賽,這種操作會(huì)重置其之前在圍棋上的所有經(jīng)驗(yàn)。Finn說:“從人類的角度看,這種學(xué)習(xí)方式很荒唐。”人類根本不會(huì)這么容易就忘記他們?cè)?jīng)學(xué)會(huì)的東西。

 

AlphaZero在游戲方面的成功不僅僅來源于有效的強(qiáng)化學(xué)習(xí),還要?dú)w功于一種算法(利用了一種類似于蒙特卡洛樹搜索的技術(shù)),這種算法幫它減少了后續(xù)步驟的搜索空間10。換句話說,AI是被引導(dǎo)著如何從它所處的環(huán)境中最好地學(xué)習(xí)。Chollet認(rèn)為,AI接下來最重要的一步是賦予深度學(xué)習(xí)網(wǎng)絡(luò)自己寫算法能力,而不用人類提供的代碼。

 

他認(rèn)為,在基礎(chǔ)的模式匹配能力之余賦予AI推理能力,有利于AI應(yīng)對(duì)它們不熟悉的輸入數(shù)據(jù)。讓計(jì)算機(jī)自動(dòng)生成代碼的合成技術(shù)已經(jīng)被研究了很多年,Chollet相信,通過與深度學(xué)習(xí)技術(shù)的結(jié)合可以讓基于深度神經(jīng)網(wǎng)絡(luò)的系統(tǒng)更接近人類的抽象智力模型。

 

在機(jī)器人領(lǐng)域,臉書AI研究院的計(jì)算機(jī)科學(xué)家、德克薩斯大學(xué)奧斯丁分校教授Kristen Grauman正在教機(jī)器人如何更好地自主探索世界,包括在新場(chǎng)景中應(yīng)該觀察哪里,如何操作物體才能更好地掌握它的形狀或用途。這么做的初衷是讓AI可以預(yù)測(cè)出哪些新視角可以提供最有利學(xué)習(xí)的新數(shù)據(jù)。

 

該領(lǐng)域的研究人員表示,他們正在逐步解決深度學(xué)習(xí)的缺陷,同時(shí)也在不斷探尋新的技術(shù)提高這一過程的穩(wěn)定性。目前深度學(xué)習(xí)還沒有太多的理論支撐,Song說,“如果某個(gè)地方不靈了,我們很難找到原因。整個(gè)領(lǐng)域依然有賴于經(jīng)驗(yàn),不斷嘗試就對(duì)了。”

 

目前來說,雖然科學(xué)家意識(shí)到深度神經(jīng)網(wǎng)絡(luò)的脆弱性,以及它們對(duì)大量數(shù)據(jù)的依賴性,但大部分人依然認(rèn)為這一技術(shù)已經(jīng)建立了起來。研究人員在這十年中,通過巨量的計(jì)算資源訓(xùn)練神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了如此優(yōu)異的模式識(shí)別,給我們留下了深刻的啟示。“但沒有人知道如何讓它變得更好。”Clune說。

------分隔線----------------------------
    ?分享到??
看看啦
主站蜘蛛池模板: 久久精品中文字幕一区| 国产伦精品一区二区三区无广告 | 亚洲av无码一区二区三区不卡| 亚洲国产美国国产综合一区二区| 日韩在线视频一区二区三区| 亚洲一区二区三区四区视频 | 国产综合一区二区| 国产精品一区二区在线观看| 午夜AV内射一区二区三区红桃视 | 亚洲av无码一区二区三区天堂 | 在线中文字幕一区| 国产日韩精品一区二区三区在线| 天堂一区二区三区在线观看| 色综合视频一区二区三区| 在线观看国产一区二三区| 日韩一区二区电影| 国产精华液一区二区区别大吗| 一区一区三区产品乱码| 精品国产一区二区三区麻豆| 亚州日本乱码一区二区三区| 无码人妻一区二区三区在线 | 中文字幕人妻丝袜乱一区三区| 免费人人潮人人爽一区二区 | 国产在线观看一区二区三区四区 | 无码人妻精品一区二区三区99不卡| 国产成人一区二区三中文| 蜜桃无码AV一区二区| 日韩av无码一区二区三区| 一区二区三区日韩| 久久人妻av一区二区软件| 一区二区三区91| 国产一区二区三区在线2021| 亚洲国产精品一区| 久久一区不卡中文字幕| 国产精品自拍一区| 国产一区二区三区在线看片| 亚洲国产av一区二区三区| 夜夜嗨AV一区二区三区| 亚洲一区欧洲一区| 国产精品亚洲一区二区无码 | 亚洲一区二区三区91|