《為什麼》5:六個判斷力層級
我們要來講一個特別基本的問題,和一個新特別的解法。這個解法可以說是這本書的一個魅力所在,是科學的進步。
問題很簡單。你怎麼知道一個東西到底是不是真的有效呢?
1. 老百姓的層次
日常生活中常面對這樣的問題,例如賣很貴的保鍵品,那你怎麼知道它是不是真的有效呢?這一個問題,就能把人按見識長短拉開很多檔次。
■ 最底層的判斷力:貴就有效
既然這個東西〝貴〞,那就肯定有效。有一個笑話叫〝珍珠翡翠白玉湯〞 — 也就是白開水,雖然貴,但對身體沒有任何作用。
有人往白酒加金箔,喝酒就是喝黃金,但你要知道它是不能把你的身體變黃金的,然而這種認知就可以在中國刷掉很多人。
〝貴〞可以讓你覺得有效,最多相當於〝理論上應該有效〞,可是真正有沒有效,得看實踐。
■ 第二層判斷力:熟人覺得有效,所以我認為它有效。
有個熟人覺得吃這個保健品有效,所以我認為它有效。這一條又刷掉了很多人。
一備子能證明有效嗎嗎?可能熟人那幾天偶然身體不好,本來不吃也能恢復,吃保健回恢復完全是巧合。你最起碼知道大多數人吃了這個保健品有沒有效,以級,這個保健品有沒有害。
■ 第三層判斷力:對人群的研究
假設二十年後中國人民的文化水平普遍提高,這個保健品集團為了跟上人民日益增長的智商,委託內蒙古大學出了一個報告,說吃了這個保健品的人群的身體狀況,平均而言,比沒吃的人群好。那這個報告能說明這個保健品有效嗎?
還是不能。保健品賣得挺貴,吃這個保健品的一般都是有點錢的人。這些人的醫療保障、生活環境、飲食結構各方面都比窮人要好,他們的身體狀況本來就〝應該〞更好。你怎麼能知道是吃了保健品的人身體好呢,還是身體好的人更容易買保健品吃呢?
這些都是老百姓的水平判斷力。那科學家會怎麼做呢?
2. 混雜偏誤
上一講說的貝葉斯方法適合每次遇到一個新證據的情況,今天我們說說科學家使用的大規模統計研究。X 對 Y 有效,就是要建立從 X 到 Y 的因果關系: X → Y 。
事情的複雜之處在於,往往會有一個其他因素, Z ,既影響了 X 也影響了 Y。因為關系圖如下:
比如說, X 代表每天鍛練身體, Y 是身體健康, Z 是年齡。我們希望證明鍛練身體能促進身體鍵康,但是你得考慮年齡因素。
年輕人更愛鍛練身體,年輕人的身體也更健康。那當你觀察到愛鍛練身體的人更健康這個現象,你就不知道是 X 導致了 Y,還是因為 Z 同時影響了 X 和 Y。
統計學上管 Z 叫〝干擾因素 ( confounding factor )〞,也叫潛在變數。不考慮 Z 就貿然說鍛煉對身體有好處,那你就犯了混雜偏誤,也叫〝混淆偏移〞,英文是confounding bias。 Z,混雜了 X → Y 的因果關係。
但是你很容易就能去除 Z 的混雜。比如如果年齡是個干擾因素,那我們可以只考察同一個年齡段的人,看看其中鍛煉和不鍛煉的人的健康區別。如果同為50歲,鍛煉的人比不鍛煉的人身體好,那就說明在年齡之外,鍛煉真可能有好處。
在統計學上這叫〝控制變量〞, 我們控制了年齡因素,〝controlling for Z〞,再看 X 和 Y 之間有沒有關係。
而年齡之外還可能有別的因素。比如時間也是個因素,工作輕閒的人有更多時間鍛煉,同時工作輕閒的人身體狀況也可能更好,所以你還得控制〝工作清閒〞這個變量。
前面說保健品的時候提到的經濟條件可能影響健康,而且經濟條件好的人的確更愛鍛煉,所以我們必須控制經濟條件這個變量。
根據我的主觀標準,判斷力的第四層,就是如此這般、你想到一個因素就控制一個因素這己經是科學方法。大量學術研究都是這麼做的,控制了各種可能因素之後,給你一個結論: X 跟 Y 之間有這麼一個推測性的關係。
這個方法的問題在於你永遠都無法窮盡所有可能的干擾因素,也許就是有一些變量是你沒想到、或者來不及控制的!所以你還是不敢說 X 跟 Y 有因果關係!
3. 隨機實驗
■ 第五層判斷力:隨機實驗
隨機實驗的創始人是英國統計學家羅納德.費舍爾 ( Ronald Fisher )。
大約是1, 923年,費舍爾在研究肥料對農作物生長的影響。他可沒像某些保健品那樣,說這個肥料貨真價實用的都是好材料就一定是好肥料。
費舍爾老老實實做實驗。弄兩塊實驗田,一塊用 1 號肥料一塊用 2 號肥料,看看哪塊田的莊稼長得好,這行不行呢?
問題在於世界上根本沒有完全相同的兩塊田。有些土地的灌溉比較好,有的地方蟲害少,不同土地的酸鹼度也不一樣,所有這些都是干擾因素,你得想辦法控制。
費舍爾意識到,不管怎麼控制,他都無法排除所有的潛在干擾因素。
最後費舍爾想了一個辦法。他說我乾脆來個〝隨機〞實驗。他找了很多塊土地,把土地隨機地分成兩組,一組用 1 號肥料,另外一組用 2 號肥料。
大規模隨機分組的好處就在於,因為沒有使用任何主觀分類標準,那就不管你有什麼干擾因素,這個干擾因素在兩個組裡的強度應該是大致相同的。只要實驗的樣本量足夠大,隨機分成的兩組之間就不會有本質的差異。
這是一個天才的設想,能夠排除一切干擾因素!不但如此,費舍爾還能用統計方法估算隨機實驗得出結論的不確定性到底有多大。比如說你可以用〝p值〞代表不確定性,我們專欄前面有一篇《P<O.05:科學家的隱藏動機》專門講過。
隨機實驗現在是臨床醫學的黃金標準。凡是有新藥出來,美國 FDA 都會要求做大規模的隨機實驗。你不拉出來溜溜,又怎麼能科學判斷到底是騾子是馬呢?
隨機實驗是判斷力的第五層,可以說現在你找不到更準確的判斷方法一一但是它仍然不是最先進的方法。
關鍵在於,有些事情總不能做實驗。比如你想知道吸煙是否真的導致了癌症,你總不能把人分成兩組,逼著其中一組人每天吸菸吧?
如果不能做實驗,你就還得做些事後的統計, 比如看看煙民得肺癌的比例是不是比一般人高一一然後你就還得各種控制變量。
4. 到底應該控制誰
■ 第六層判斷力:因果關係控制變量
第六層判斷力,也是過去三十年因果革命怕勺一個傑出貢獻,就是用更簡單、更準確的方法決定到底應該控制哪些變量。
以前、包括現在還有很多研究者寫論文,都不知道到底應該控制哪些變量,索性就把所有相關的因素都給控制一遍,連有些不該控制的也給控制了,反而導致結論出錯。
因果革命的一個重大突破是在數學上發明了do-算符。沒有這個算符,統計學家永遠都說不清到底什麼樣的因素是干擾因素 — 干擾因素根本就不是單純用統計數據能定義的概念。有了這個算符,我們就可以說,所謂〝存在干擾因素〝.就是 — —
具體的技術細節對非專業人士意義不大,我們就不講了。你只要知道根據這個定義,科學家得出了兩條判斷規則。給定任何一個因果關係圖,我們都能使用這兩條規則確定,到底哪些變量應該被控制。
第一條規則是〝後門〞路徑的訊息傳遞必須被隔斷。所謂後門路徑,就是從 X 到 Y 的一條連通路徑,其中起始的箭頭指向X。後門路徑中可能包含干擾因素,你需要控制其中一個變量,阻斷信息傳遞。
第二條規則是如果後門路徑中有〝A → B ← C〞這樣的碰撞結構,那就不要控制了,因為其中的 B 已經姐斷了 A 和 C 的信息交流,控制反而會帶來干擾。
我們舉幾個因果關係圖的例子,你唯一需要從中體會就會這個做法有多簡單。
( 1 )
圖中沒有後門路徑,不需要控制任何變量。
( 2 )
X ← A → B ← D → E → Y 是一條後門路徑。很多研究者會控制其中的變量,但那是錯的!注意 B 處是一個碰撞結構,它已經阻了訊息,這張圖根本不需要控制變量。
( 3 )
X ← B → Y 是個後門路徑,我們需要控制變量 B。
你看這個方法是不是就好像遊戲一樣。複雜的邏輯結構被變成了簡單的數學遊戲。這是因果革命的偉大貢獻!
拍爾說,如果你的因果關係圖已經包含了所有重要的因素,而你的控制變量又做得足夠好, 那麼只要 X 和 Y 之間還有協同的變化,你就有充分的權利說,你找到了一個臨時性的 X → Y 因果關係。這樣的結論不能說比隨機實驗低一等,要知道隨機實驗也有自己的不確定性。
| 由此得到
在真實世界裡獲得一點知識是很難的。有誰能想到,一句〝這東西真有效嗎?〞,居然引出了一個規則怪異的數學遊戲!但這也正是科學家跟老百姓的區別。
老百姓的判斷方法是一看夠不夠貴,二聽熟人的證詞,最多最多本著〝孤證不舉〞的精神去了解一下人群的總體效果。
而科學家的方法則是控制變量和做隨機實驗。以前費舍爾剛提出隨機實驗的時候人們還不太理解,說怎麼能把答案交給不確定性呢,這就是高觀點和低觀點的差距。
今天因為因果革命,判斷力達到了第六層。如果你能見識到這一層,你的判斷力段位就會比大多數科學家還厲害。
人說當今的世界貧富差距大,我看人跟人的見識差距更大。
來源:《萬維綱-正確的學習方法只有一個》