《為什麼》2:總有一種力量讓我們回歸平均

讀書學習

因果關系到底是不是一種原始的、應該被現在科學拋棄的思維呢?為了理解這件事,後今天要講一個非常經典的統計學概念,它在生活中有各種應用,但是至今仍然有很多體面人因為不懂這個概念而犯錯誤。

 

這個概念叫做〝回歸平均〞。這一切還得從舉世罕見的聰明人、學術多面手、人類學家、著名的種族主義者、發明家、統計學的組師爺、達爾文的表弟「弗郎西斯.高爾頓」先生講起。

 

1. 高爾頓的困惑

 

1877 年,高爾頓在英國皇家科學做了一個演示報告。皇家科學院的報告傳統真是讓人心馳神往啊。聽眾都是各方面的牛人,正裝出席報告人不用什麼 PPT,而是面向觀眾就好像變魔術一樣,一邊演示實驗一邊侃侃而談,說的都是對大自然的最新揭秘。

 

高爾頓這次演示的東西,被後世稱為〝高爾頓板〞。 高爾頓板現在還有賣,它是一個平板,下部有很多垂直的槽,槽上面是一些排列成三角形的小格檔。

 

 

 

讓一個小球從最上方掉下去它會經過各個隔擋的阻礙,最終落到一個豎槽裡。每個小球在進入豎槽之前的運動都是隨機的,但是當你放了很多很多小球之後,它們就會在豎槽上呈現一個明顯有規律的分佈:一條鐘形曲線。

 

這當然就是正態分佈。高爾頓板演示的是人的遺傳。比如身高和智商,可能受多個遺傳因素的影響―就好像高爾頓板上的那些隔擋 — 這些因素綜合起來一起作用,結果就一定是正態分佈。事實上人的身高和智商的確就是正態分佈。你可以想像上面圖中橫坐標代表身高,縱坐標代表每個身高值上的人數。正態分佈就是說身高特別高和特別矮的人都很少。

 

正態分佈不是新聞。高爾頓這個報告的真正劇情還在後面。高爾頓說如果我在豎槽下面再放上一些隔擋,然後隔擋下面再放上第二排豎槽就如同下圖中右邊那樣,你說會是什麼樣的情景?

 

 

這就模擬了兩代人的身高。第一排,也就是豎槽 A ,代表第一代人的身高分佈,我們知道是正態分佈。那麼第一代人再遺傳一次到達豎槽 B 會是什麼分佈?

 

不論是理論推導還是實驗演示,第二排豎槽裡的小球都呈現一個更寬廣的正態分佈。豎槽B的標準差更大。就如同下面這樣―

 

 

這意味著每一代人身高的標準差會越來越大,也就是身高特別高和特別矮的人應該一代代越來越多才對。

 

可是真實世界根本就不是這樣的。真實世界裡一代代人的身高標準差都是一樣的!

 

我再換個說法你就更明白了。假設現在有一批身高特別高的人,他們處在第一代正態分佈曲線的右側邊緣地帶。如果他們生的孩子是在他們的身高基礎上進一步隨機演化的話其中應該有一半人的身高比父輩高。如此說來第二代身高的邊界應該比第一代更寬才對。

 

但是這並沒有發生。真實世界裡牛人的第二代並沒有一半的機會比牛人強,二代好像普遍比一代弱。高爾頓考察了 605 個英國名人就發現這些名人的兒子們普遍不如名人自己有名。

 

這個規律好像還無處不在。比如姚明特別高他的妻子也非常高我們可以想像姚明的女兒肯定也會很高 ― 但是根據高爾頓發現的規律,姚明女兒的身高將不會像姚明那麼高。最可能的結果是她會稍微矮一點。

 

高爾頓把這個現象叫做〝回歸平庸〞。一代出類拔萃佔據了正態分佈曲線邊緣的位置;二代則普遍沒有接著開疆拓土,甚至連一代的優勢都沒保住反而都往曲線的中間“回歸”。

 

高爾頓不得不把高爾頓板做了一個改進,把一些豎槽變成斜槽才能體現這個“回歸'

 

 

可這斜槽代表什麼呢?難道說冥冥之中有一種力量讓我們回歸平庸嗎?

 

2. 高爾頓的解釋

 

有些問題值得思考十二年。一直到 1889 年離爾頓才把這個事想明白。

 

高爾頓意識到根本就沒有什麼特殊力。

 

他考察英國男子的身高和手臂之間的關係,發現身高特別高的人,手臂也都很長 ― 但是他們的手臂並不是最長的。這就好像最聰明的父親沒有生出.聰明的兒子一樣。手臂相對於身高也出現了回歸平庸。

 

那我們想想,父親跟兒子之間也許有因果關係,身高跟手臂之間似乎不太司能有因果關係啊。

 

更進一步父親相對於兒子,也有一個回歸平庸!如果你先看兒子身高,那些最高的兒子,他們的父親的身高也不是最高的。顯然兒子身高並不能決定父親的身高,這個關係肯定不是因果關係!

 

高爾頓把這種關係叫〝相關〞。這就是〝相關性〞這個概念的起源。高爾頓是第一個意識到〝相關不是因果〞的人。

 

兒子出生的時候父親已經成年了,兒子身高總不可能影響父親的身高,所以絕對不可能有一種什麼神秘力,決定了從兒子到父親的回歸平庸。

 

今天我們把這個現象叫〝回歸平均 ( regresson toward the mean )〞 。

 

 

3. 回歸平均

 

想要理解回歸平均,你得理解下面這兩個公式 — 

 

■ 成功 = 天賦 + 運氣。

■  大成功 =  多一點點天賦 + 很多好運氣。

 

你得承認運氣的作用。

 

 

具體到身高來說,我們的身高有一部分是直接繼承了父母的基因,還有一部分是直接繼承了父母的質因,還是一部份是遺傳基因的排列組合、跟環境的相互作用影響到基因表達,這些過程中發生的一些運氣。

 

高個父親不但有好基因而且有好運氣。基因可以遺傳可是運氣不能遺傳。好運氣總是非常罕見的,所以大概率下,兒子不會有那麼好的運氣 — 所以兒子的身高就不如父親。

 

這就好比說如果父親的時,很大一部分是來自買彩卷中了大獎,我們容易理解兒子將來不會像父親一樣有錢。比如中國有句話叫,不過三代其實並不見得是第二代和第三代從小驕奢浮逸不會賺錢了,可能僅僅是因為第一代的好運氣是不可繼承的。

 

所以回歸平均其實就是一個簡單的統計現象,本質原因是小概率事件,不會一再發生,這裡面並沒有什麼神秘力量。

 

 

4. 回歸平均種種

 

我給你舉幾個例子。一個電影大獲成功,於是就出了續集。可是續集的票房往往不如第一部高,這是為什麼呢?用回歸平均完全可以解釋好電影的續集往往不好。第一部電影之所所大受歡迎,是因為它的運氣好。好運氣總是稀少的,第二部電影沒有這麼好的運氣,所以就獲得平庸的票房。其實平庸票房詪正常,第一部大獲大成才是真的不正常。

 

我最歡的一個例子還是卡尼曼講的。有一次卡尼曼給以色列空軍辦講座,卡尼曼講到心理學,說你要要想讓你的學員進步,一定要多正面鼓勵,不要去罵他們,心理學家有充分的證據,正面鼓勵比打罵有效得多。

 

這時候有一個教官表示不同意。他跟卡尼曼說我的經驗可不是這樣的,如果一個飛行員有一天飛得特別好我當場表揚他、鼓勵他了他第二天往往飛得沒有那麼好。可是如果一個人飛的特別差,我罵他一頓他第二天裡然就飛得沒有那麼差了。這不就說明表揚沒用打罵有用嗎?

 

卡尼曼一時語塞!他後來才想明白這個件事,這其實是回歸平均。

 

飛得特別好這種事情並不容易發生,你表場或者不表揚他,他下一次飛也會回歸平均,會沒有那麼好。飛得特別不好也是一個小概率事件,你批評或者不批評他,他下一次飛也會回歸平均,會沒有那麼差。在回歸平均這個大趨勢面前表場固然沒有立竿見形的作用,批評的作用其實也是錯覺。

 

好。這個道理是,有些事發生就發生了並沒有緣故。

 

 

5. Reason 和 Cause

 

說到這我想辨析兩個英文單字,〝reason〞和〝cause〞。這兩個詞的意思差不多都是原因,但你細品的話,它們有重大區別。

 

所謂 reason,是對這件事的解釋。比如你問我電影的續集為什麼票房不高,我說這個是回歸平均,這就是對事情有一個解釋

 

cause,則是導致這件事的另一件事。你現在為什麼感覺到有點餓,因為你沒吃早餐。Cause 就是〝因為關系〞裡面的那個〝因〞,後統一翻譯成〝緣故〞。

 

為什麼高個父親的兒子往往沒有他高?這件事有個解釋,但是沒有緣故 ― 沒有一個神秘力量〝導致〞兒子的身高變矮,這純釋是個統計學現象。

 

為什麼你買彩從中了大獎?這有一個解釋 —  總會有人中大獎,這次碰巧是你。但是沒有緣故 ― 並不是因為你昨天做好事幫助孤獨老人〝導致〞了你今天中大獎。

 

世界上有些事,是無緣無故發生的。

 

高爾頓終於意識到回歸平均這個現像根本就沒有〝cause〞。他意識到 1877 年的自己犯了一個以為什麼事都有緣故的錯誤,他的因果慣性思維害了他。

 

高爾頓痛定思痛,乾脆認為世界上一切事物都沒有因果,後來高爾頓的徒弟叫卡爾.皮爾遜 ( Karl Pearso ) ,把這個思想給發展壯大了。

 

 

| 小結

 

所謂 reason,是說對這件事的解釋。而 cause ,則是導致這件事的另一件事。世界上有些事情,是無緣無故發生的。回歸平均其實就是一個簡單的統計現象,本質原因是小概率事件,不會一再發生 — 這裡面並沒有什麼神秘力量。

 

 

來源:《萬維綱-總有一種力量讓我們回歸平均》

Gimmy
作者: Gimmy
積極的人在每一次憂患中都看到一個機會 而消極的人則在每個機會都看到某種憂患

發表迴響