- 系 統(tǒng)
- 進(jìn)階教程
- 微軟認(rèn)證
- Win7/WinX
- 優(yōu)化
- 系統(tǒng)故障
- Windows NT
- 社區(qū)
自從 AI 搭乘 AlphaGo 出道以來,關(guān)于感知智能需要向認(rèn)知智能進(jìn)化的討論被提上日程,因?yàn)殡m然 AlphaGo 戰(zhàn)勝了李世石,但是為什么 AI 會(huì)贏,其中的因果關(guān)系沒人知道。認(rèn)知智能的理想發(fā)展路線,是從認(rèn)知心理學(xué)、腦科學(xué)及人類社會(huì)歷史中學(xué)習(xí),并結(jié)合領(lǐng)域知識(shí)圖譜、因果推理、持續(xù)學(xué)習(xí)等技術(shù),建立穩(wěn)定獲取和表達(dá)知識(shí)的有效機(jī)制,讓知識(shí)能夠被機(jī)器理解和運(yùn)用,讓 AI 能夠回答為什么的問題,實(shí)現(xiàn)從感知智能到認(rèn)知智能的關(guān)鍵突破。
這其中的關(guān)鍵方法,就有我們今天要討論的主題——因果關(guān)系。
什么是因果關(guān)系?
18 世紀(jì),蘇格蘭不可知論哲學(xué)家大衛(wèi)·休謨提出“因果關(guān)系是人類的錯(cuò)覺”(即人們所謂的因果,實(shí)質(zhì)上是對(duì)“相關(guān)關(guān)系”的歸納推理,而相關(guān)性無法保證因果性),用懷疑論毀掉了因果律,否認(rèn)了理性分析的作用,引發(fā)哲學(xué)危機(jī)。從此,科學(xué)家就未停下過對(duì)因果關(guān)系的爭論。
那么,什么是因果關(guān)系?因果關(guān)系有多重要?
從定義上來說,人們對(duì)因果關(guān)系最常見的誤解,是會(huì)將其與相關(guān)關(guān)系混淆?!稅凵辖y(tǒng)計(jì)學(xué)》一書舉例說明了兩者之間的區(qū)別:在美國中西部的一個(gè)小鎮(zhèn),地方警察局局長發(fā)現(xiàn)冰淇淋消費(fèi)量越多,犯罪率就越高。這個(gè)例子中,冰淇淋消費(fèi)量和犯罪率是正相關(guān)的,但并不意味著冰淇凌消費(fèi)的增多導(dǎo)致了犯罪率的上升,更不可能通過減少冰淇凌的銷售來降低犯罪率。
事實(shí)上,存在某個(gè)變量同時(shí)和冰淇淋消費(fèi)量、犯罪率相關(guān),這個(gè)變量就是室外溫度。當(dāng)室外氣溫變暖,如在夏天,就會(huì)有更多犯罪(白天更長,人們多開窗口等)。而因?yàn)樘鞖庾兣藗兏硎艹员苛璧臉啡?。相?duì)地,在又長又黑暗的寒冬,冰淇凌的消費(fèi)就減少,同時(shí)犯罪也越少。
這里,冰淇淋消費(fèi)量與犯罪率只是相關(guān)關(guān)系,雖然表面上存在著一定程度上的詭異關(guān)系,但是卻非因果關(guān)系。
因果關(guān)系的抽象定義是這樣的——如果保持系統(tǒng)中其他變量都不變,只改變其中的一個(gè)變量(比如通過人工降雨來下雨),然后發(fā)現(xiàn)有另一個(gè)變量也隨之改變(比如我們發(fā)現(xiàn)地上由干變濕了),那么我們就說前面一個(gè)變量(是否下雨)是后一個(gè)變量(地上是否濕)的一個(gè)原因。一個(gè)典型的因果模型可以通過直觀的圖模型來描述,或者通過從因到果的數(shù)學(xué)函數(shù)來刻畫。
此后數(shù)百年來,自然科學(xué)和社會(huì)科學(xué)中有很多科學(xué)家在嘗試針對(duì)因果關(guān)系的檢測方法,比如2002 年,加州大學(xué)伯克利分校教授亨利·布雷迪撰文整理了因果推斷的各種經(jīng)典理論,并根據(jù)不同假設(shè),將其分為新休謨理論、反事實(shí)理論、操控實(shí)驗(yàn)理論、機(jī)制理論 4 大類,而從計(jì)算視角,近年來還興起了基于統(tǒng)計(jì)獨(dú)立性、分布變化性、因果過程復(fù)雜度和“壓縮感知”的新方法。新的方法不斷出現(xiàn),但萬變不離其宗,并且與哲學(xué)的緊密關(guān)系不減反增,其中包括卡內(nèi)基梅隆大學(xué)哲學(xué)系(并在機(jī)器學(xué)習(xí)系兼職)副教授張坤在做的事。
一個(gè)用因果思維做機(jī)器學(xué)習(xí)的科研人
在張坤看來,哲學(xué)與機(jī)器學(xué)習(xí)看似兩個(gè)毫不相關(guān)的領(lǐng)域,但其實(shí)有著很多交集,他本人就是一個(gè)跨越兩個(gè)學(xué)科的科研人。在卡內(nèi)基梅隆大學(xué),張坤是哲學(xué)系教授,同時(shí)指導(dǎo)機(jī)器學(xué)習(xí)系博士生,并且是德國馬克思普朗克智能系統(tǒng)研究所高級(jí)研究員。他的主要研究方向是機(jī)器學(xué)習(xí)和人工智能,特別專注于因果發(fā)現(xiàn)和因果機(jī)器學(xué)習(xí)的研究。在機(jī)器學(xué)習(xí)頂級(jí)會(huì)議和期刊上,他的團(tuán)隊(duì)每年展示十余篇論文, 他并擔(dān)任 NeurIPS、ICML、UAI 等多個(gè)頂級(jí)會(huì)議的領(lǐng)域主席。
為什么說兩個(gè)學(xué)科之間有交集?張坤的團(tuán)隊(duì)希望有更好的認(rèn)識(shí)論和更恰當(dāng)?shù)姆绞絹矶x和解決實(shí)際問題。哲學(xué)思維方式能讓他們更在意問題如何定義以及問題本身意義何在,而機(jī)器學(xué)習(xí)的背景和思維方式讓他們腳踏實(shí)地從數(shù)據(jù)出發(fā)發(fā)現(xiàn)新的信息并進(jìn)而更新其傳統(tǒng)認(rèn)識(shí)。張坤認(rèn)為,哲學(xué)與機(jī)器學(xué)習(xí)兩者之間類似于思和學(xué)的關(guān)系——學(xué)而不思則罔,思而不學(xué)則殆。
張坤在中國科學(xué)技術(shù)大學(xué)讀完本科,在香港中文大學(xué)計(jì)算機(jī)系獲得博士學(xué)位。在讀博期間,他對(duì)如何從機(jī)器學(xué)習(xí)的角度看因果關(guān)系產(chǎn)生了很大興趣,于是便從機(jī)器學(xué)習(xí)領(lǐng)域中逐漸縮小關(guān)注范圍。最終將主要研究領(lǐng)域聚焦于因果發(fā)現(xiàn)和因果思維方式的機(jī)器學(xué)習(xí),雖然當(dāng)時(shí)在機(jī)器學(xué)習(xí)領(lǐng)域幾乎還沒什么人關(guān)注因果性。
在讀博期間,張坤第一次接觸到機(jī)器學(xué)習(xí)相關(guān)的研究課題,當(dāng)時(shí)的目的是做更好的獨(dú)立成分分析的方法。做那個(gè)課題的過程中,他深刻地感覺到,做研究要么著眼于重要的待解決問題而不受領(lǐng)域的限制,要么著眼于重要的還未被公認(rèn)完善的方法而不被應(yīng)用限制。如果兩者都不是,可能需要想一想自己的研究到底要做什么樣的貢獻(xiàn)。
因果關(guān)系,就是一個(gè)重要的待解決的問題,也是具有重要意義的還未有完善方法的方向。在 CMU,張坤的主要研究方向就是在各種場景下如何找出真正的因果關(guān)系,以及如果解決一系列具有數(shù)據(jù)異質(zhì)性的機(jī)器學(xué)習(xí)問題。他所在的小組在這兩個(gè)方向并駕齊驅(qū),這幾年在研究上取得了一系列進(jìn)展,比如他們可以從觀測數(shù)據(jù)中自動(dòng)找出背后有相互因果關(guān)系的隱變量。在他看來,這是一次不小的進(jìn)步。
在在此之前,張坤有不少因果關(guān)系相關(guān)的研究成果出來,其中最為重要的成果包括他提出的自動(dòng)因果關(guān)系發(fā)現(xiàn)方法以及用因果的思維方式解決遷移學(xué)習(xí)等問題??傮w來說,前者將就是通過機(jī)器學(xué)習(xí)的方式,分析各種各樣的觀測數(shù)據(jù),以找到背后的因果關(guān)系。張坤說到,在一些假設(shè)條件下,因果關(guān)系發(fā)現(xiàn)其實(shí)就是機(jī)器學(xué)習(xí)問題,問題是我們需要合適的或者很弱的假設(shè),這是因果關(guān)系和數(shù)據(jù)之間的橋梁。上世紀(jì) 90 年代初,該方向的研究曾獲得很大進(jìn)展,因果發(fā)現(xiàn)問題得到部分的解決。而在過去十幾年間,機(jī)器學(xué)習(xí)的思維方式的介入更是促進(jìn)了因果關(guān)系突飛猛進(jìn)的變化。而用因果的思維方式解決遷移學(xué)習(xí)問題,可以幫助我們判斷系統(tǒng)的那些信息可被遷移,以及如何遷移。
張坤介紹到,近年來,因果發(fā)現(xiàn)有了不少新的理論和算法,大致是圍繞如何利用異構(gòu)數(shù)據(jù)以及如何自動(dòng)構(gòu)建隱藏的因果變量,而張坤團(tuán)隊(duì)最近的自動(dòng)構(gòu)建隱變量及其之間因果關(guān)系的方法,已經(jīng)被應(yīng)用到一系列心理學(xué)問題上。用他的話說,“得到了全新且有意義的結(jié)果,直接幫助他們重構(gòu)、理解和干預(yù)心理上事實(shí)存在的各個(gè)維度。”張坤還提到,在這類問題上,華南工業(yè)大學(xué)的蔡瑞初老師團(tuán)隊(duì)也做出了令人興奮的結(jié)果。
因果關(guān)系落地難點(diǎn)
具體來說,因果關(guān)系下大概分兩個(gè)研究領(lǐng)域,其一是因果發(fā)現(xiàn),它可以回答“為什么”的問題;其二是有了定性因果關(guān)系后,如何確定一個(gè)變量對(duì)另一個(gè)變量的因果影響,比如,它可以幫我們確定不同治療方式對(duì) COVID-19 的療效。張坤認(rèn)為,因果關(guān)系的研究領(lǐng)域現(xiàn)在還應(yīng)該再增加一個(gè),就是因果智能機(jī)器學(xué)習(xí),它可以幫我們實(shí)現(xiàn)更魯棒、更具適應(yīng)性、更通用的機(jī)器學(xué)習(xí)系統(tǒng)。
關(guān)于因果關(guān)系的基礎(chǔ)研究范圍在不斷拓扎和完善,大家關(guān)心的更多的還有其在實(shí)際場景中落地有哪些進(jìn)展與難度。
張坤提到,因果關(guān)系在實(shí)際場景落地的最大困難,是需要掌握和使用要解決問題的特定性質(zhì),以及熟悉哪些問題一定需要用因果的思維方式才能解決,如此才能精確、高效的找到背后的因果關(guān)系并加以適當(dāng)應(yīng)用。“舉例來說,現(xiàn)實(shí)中我們測量出來的變量往往有很大噪聲,甚至并不是我們真正想找的變量,系統(tǒng)有觀測噪聲這樣的信息都可以幫助我們大大降低搜索空間,從而提高搜索效率并改善最終結(jié)果,”張坤表示。
因果關(guān)系研究并不完善,亟待更多人才
實(shí)際上,張坤告訴 CSDN,因果關(guān)系相關(guān)的基礎(chǔ)研究并不完善,因?yàn)檫@還是一個(gè)較新的領(lǐng)域,很多實(shí)際問題還未得到好的解決,甚至還沒有被很好地刻畫出來。他認(rèn)為,用非參數(shù)的方式自動(dòng)構(gòu)建因果隱變量會(huì)是很未來重要的方向,無論是對(duì)于單純的因果研究領(lǐng)域還是機(jī)器學(xué)習(xí)領(lǐng)域。
有著巨大挖掘和進(jìn)步空間的因果關(guān)系領(lǐng)域,還需要更多人才的加入。對(duì)于那些對(duì)因果關(guān)系研究感興趣的同學(xué),張坤推薦了一些入門書籍和資料,包括 Judea Pearl 的 Causality: Models, Reasoning, and Inference,Peter Spirtes, Clark Glymour and Richard Scheines 的 Causation,Prediction,and Search,前者注重在概念和因果影響辨識(shí)問題(假設(shè)定性的因果影響已知),后者著眼于如何從數(shù)據(jù)發(fā)現(xiàn)因果關(guān)系。
此外,張坤提到 Clark Glymour 和他本人正在寫一本關(guān)于因果發(fā)現(xiàn)的書,目前還未完工,希望完成之后能為大家提供比較及時(shí)、系統(tǒng)的因果發(fā)現(xiàn)以及如何使用因果關(guān)系的素材,大家可以關(guān)注一下。
另外一個(gè)問題大家可能也會(huì)關(guān)心——學(xué)習(xí)因果關(guān)系方向需要掌握扎實(shí)的數(shù)理知識(shí)基礎(chǔ)嗎?對(duì)學(xué)生入門學(xué)習(xí),專家有哪些建議?
對(duì)此,張坤表示入門因果關(guān)系確實(shí)需要扎實(shí)的數(shù)理知識(shí)基礎(chǔ),他的建議就是別怕那些概念——畢竟因果關(guān)系不僅僅是對(duì)觀測數(shù)據(jù)的現(xiàn)象描述,它需要一個(gè)新的描述體系。把那些概念吃透,變成自己思維方式的一部分。同時(shí)多考慮一些看起來寬泛的問題,比如人為什么在意因果關(guān)系以及人如何學(xué)習(xí)因果關(guān)系。在不同階段,我們對(duì)這類問題的回答會(huì)有不同,更好的答案會(huì)直接催生更好的學(xué)習(xí)方法,而對(duì)更好的回答的追求也會(huì)給我們?cè)丛床粩嗟膭?dòng)力。 |