《為什麼》1:洞見因果的三種思維
我們今天開始說一本三月份剛剛出本的新書,《為什麼:因果關系的新科學 ( The Book of Why: The New Science of Cause and Effect ) 》。這本書的作者是一位傳奇人物, 81 歲的計算機科學家和哲學家朱迪亞.珀爾 ( Judea Pearl )
1. 為什麼要問為什麼?
每個人都會問〝為什麼〞,那為什麼要這麼興師動眾的研究〝為什麼〞呢?我們來舉幾個例子。
有一種新藥賣得很貴,調查發現幾個月以來,吃了這個藥的患者恢復程度的確比沒吃這個藥的患者要好。那你能說這個藥有效嗎?也許有錢人的身體素質和醫療條件就是更好呢?
公司上了新廣告,銷售量果然大增,你說這個廣告做得好。然而一個經理說,現在正好是夏天,我們這個產品本來就適合夏天用,那到詆是廣告還是因為季節?
這些問題歸根結底,就是為什麼。為什麼結果是這樣的,我們想知道這件事的〝緣故〞。回答為什麼,就是要找到一個因果關係:A 導致 B。用數學符號表示,就是 A → B。找到因果關系,才算理解這個事是怎麼回事,才知道採取什麼行動改變這事情。
簡單的世界通常一個緣故導致一個結果。但在複雜世界裡,你常常很難判斷一件事發生的緣故。
2. 相關就夠了嗎?
有一句話叫〝相關不是因果〞。現在基於大數據和機器學習的 AI 技術興起,很多人還愛說一句話,叫〝相關就夠了〞。
比如說,大數據分析告訴我們,當颶風侵襲某個地區的時候,那裡的沃爾瑪商店賣的一種草莓餡餅乾銷量就會大增。這是為什麼呢?沒人知道。但是有這個訊息就夠了,你看天氣預報說要來颶風你就多準備草毒餡餅的備存貨,你何必問這個為什麼呢?
早在一百年以前就有統計學家相信科學的世界裡根本沒有什麼因果。不要問為什麼,所有知識都是相關性的,人的一切行為都是基於經驗的要!我們後面還會仔細論述這個想法,但是我現在要說的就是這個想法錯了 。
為此我要建立所謂的〝因果模型〞。但在此之前,我們先研究一下因果思維到底是怎麼回事。珀爾把因果思維一共分為三個等級。先別管 AI,我們先看看人類思維到了什麼程度。
3. 三級因果思維
第一級思維叫〝觀察〞,是通過數據分析做出的預測。
你的生活經驗表明下雨會把衣服淋濕,所以下次下雨你最好撐傘這就是觀察思維。觀察是尋找變量之間的相關性,觀察就是積累經驗。
現在所有實用 Al 技術都是基於這個第一級思維。AiphaGo 下圍棋並不是它理解這步棋有什麼用,它只不過知道走這步贏棋的概率會更大。
比如你開個便利店有賣牙膏和牙線。觀察思維問的問題是如果一個顧客買牙膏的話他有多大的概率同時也買牙線呢,如果你學過概率論你知道這個問題的數學表達式是這樣的: P ( 牙線 | 牙膏 )。
這個公式的意思就是假設已經買了牙膏,求買牙線的概率是多少。這個知識對你很有用,你可以判斷要不要把牙線和牙膏放在一起,它們應該按什麼比例進貨。
所有動物有觀察思維的能力。觀察思維已經能解決很多的問題,但是遠遠不夠。
第二級思維叫〝干預〞,是預判一個行動的結果
干預,是說如果我現在把牙膏的價格提高一倍,對牙線的銷量會有什麼影響?
這不是以往的數據所能告訴你的。是,以前可能發生過牙膏價格是現在一倍的清況,但是你不能用以前那個經驗預測現在這個行動的結果。因為以前牙膏價格高是因為別的緣故。可能當時牙膏緊缺才賣得貴。
現在我們說的是不管別人家牙膏賣多少錢,你〝單方面〞採取行動,去刻意地生干預牙膏價對牙線的銷量有什麼影響,這種事從來沒有發生過。
想知道結果最好的辦法是做實驗。互聯網公司一直都在做各種 A/B 測試看看哪個標題能吸引更多點擊,什麼顏色的網頁能讓用戶停留時間更長,都是用分組測試的方法。測試是主動的干預。
從概率角度來說,我們要研究的不是前面說的那個 P ( 牙線 | 牙膏 ),而是 P ( 牙線 | do(牙膏) ),其中這個 do 是一個數學運算符號,它的意思就是做一個干預動作。
其實生活中,我們一直在做干預動作。新電影票房賣不太好,我們應該做個電視廣告呢?還是讓明星爆個料?以往的經驗可以給你一些提示,但干預動作的結果到底是怎樣,你需要更高級的判斷。
第三級思維叫〝想像〞,是對以前發生的事的反思。
第三級思維問的問題是,如果我當時是那麼做的話現在會是一個什麼樣的結果,我現在工資很低,要是我當初好好學數學,大學學的是計算機專業,現在的工資會是多少呢?
你問的是一個從來沒發生過的事清。這叫反事實(countertactual)分析。如果納粹德國搶先一步發明原子彈現在的世界會是什麼樣子?這件事在歷史上並沒有發生,你積累的大數據好像用不上。
很多人愛說一句話,叫〝歷史不容假設〞― 這句話是錯的。正是因為我們會假設,我們能想像不一樣的可能性,我們才是高級動物。
想像是智人的「超能力」。泊爾引用了赫拉利在《人類簡史》裡的說法,大約是在七萬年前,智人發生了一起〝認知革命〞 ― 智人開始想像一些不存在的東西。這是一種高級認知,人類學會了想像來沒有發生過的事情。
你沒當過程設式設計師。當你可以想像,如果你當了設式設計師,你的生活會是怎樣。能想像沒有發生的事,就說明你能對以前的事做出反思。能反思,你就能想辦法改進。是因為我們會反事實的想像,我們才會為自己的行為負責。
這三級思維,代表三個問題:
-
這件事發生了,那件事是否也跟著會發生?
-
我採取這個行動,會有什麼後果?
-
如果我當初沒有這麼做,現在會是怎樣的?
回答第一個問題也許只要有數據分析就行,回答第二和第三個問题你需要因果模型。你需要知道什麼導致什麼,有了因果模型你就能在大腦裡做各種思想實驗,你就能權衡比較,你就能為未來做計劃。以前打獵都是你自己去偶爾兩個人一起去。但是如果你知道人多力量大這個因果關係,你就能想到也許下次打獵可以多帶幾個人。我一個人打不過那個大象,五個人一起上行不行?
這樣你就做了以前從來沒有人做過的事清,你沒有數據分析但是你想像到了。這是人類智慧的偉大突變,正是因為這個突變才使得人類脫穎而出。
| 由此得到
因果思維有三個級別。
-
第一級是觀測,你要處理已經觀測到的世界。
-
第二級是干預,你要處理一個可以被觀萴的新世界。
-
第三級是想像,你要處理一個不可被觀測的、你想像中的世界。
來源:《萬維綱-洞見因果的三種思維》