因果關系到底是不是一種原始的、應該被現在科學拋棄的思維呢?為了理解這件事,後今天要講一個非常經典的統計學概念,它在生活中有各種應用,但是至今仍然有很多體面人因為不懂這個概念而犯錯誤。   這個概念叫做〝回歸平均〞。這一切還得從舉世罕見的聰明人、學術多面手、人類學家、著名的種族主義者、發明家、統計學的組師爺、達爾文的表弟「弗郎西斯.高爾頓」先生講起。   1. 高爾頓的困惑   1877 年,高爾頓在英國皇家科學做了一個演示報告。皇家科學院的報告傳統真是讓人心馳神往啊 […]

我們今天開始說一本三月份剛剛出本的新書,《為什麼:因果關系的新科學 ( The Book of Why: The New Science of Cause and Effect ) 》。這本書的作者是一位傳奇人物, 81 歲的計算機科學家和哲學家朱迪亞.珀爾 ( Judea Pearl )   1. 為什麼要問為什麼?   每個人都會問〝為什麼〞,那為什麼要這麼興師動眾的研究〝為什麼〞呢?我們來舉幾個例子。   有一種新藥賣得很貴,調查發現幾個月以來,吃了這個藥的患 […]

如何在學校之外學習新知識,怎麼系統化?系統化學習的標準是什麼?是否有可操作的步驟? 為了避免泛泛而談,我就以計算機科學為例來說明吧。   很多人問我如果原來不是學計算機專業, 想轉行做計算機軟體工程師,是否可以通過自學完成?這件事其實是可以做到的, 不過大約需要一年左右的時間學習和一年左右的時間練習。具體的做法是這樣的。   首先我們要倒著理解成為一個合格的計算機工程師需要什麼樣的知識體系。   既然是計算機工程師,一定要會寫程式, 這點大家恐怕都同意。但是大部分人 […]

今天的主題是“玩”。六歲以下兒童的主要任務不是學習而是玩而我們家長對玩,情緒複雜。   有些家長認為玩是不必要的,是意志力薄弱的表現,甚至可能還是一種墮落,正所謂〝馳騁畋獵令人心發狂〞。有些家長把玩設計成是一種休息或者獎勵,比如有個說法叫〝學習要認真地學習,玩要盡情地玩〞,把玩當做充電和調節情緒的方法。   這兩種觀點都是把孩子的玩和成年人旅遊看電影打麻將唱卡拉 OK 那種玩給混淆了。孩子的玩,是必不可少的成長環節 – 玩不但能促進學習,而 […]

牙刷原則   佩奇認為一個好的產品要有牙刷的功能。讓用戶每天都必須用上幾分鐘,就如同刷牙一樣,久而久之用戶就養成了使用該品牌產品的習慣。Google 最成功的產品是搜索服務。它的特點是用戶每天都會用個兩三次,時間一長,用戶使用 Google 的習慣就養成了,而且會把 Google 的網頁設置成開機默認網頁。   讓產品具有牙刷功能其實並非佩奇的發明,實際上寶潔公司和可口可樂公司一直在這麼做。寶潔是生產各種日用品的公司,它的產品,比如佳潔士牙膏、汰漬洗衣粉、潘婷和海飛絲的洗髮水 […]

通常有消失的行業,就會有新誕生和發展的行業,後者不僅是年輕人就業時可以關注的,而且做生意的人也應該考慮利用好那些商機。今天,我就和你分享一下美國這些年發展較決的行業。   1. 軟體行業   這個不難理解,全社會信息化水平越高,越是朝著智能化方向發展,對軟體人員的需求量一定是上升的。   軟體從業人員數量增加的原因一方面是創業公司(Start Up)的數量在劇增, 另一方面是大公司一直在招人,而它們招人的目的其實不同。   創業公司招人是因為看到了 IT […]

我們通常比較喜歡確定性,不喜歡隨機性。但是在計算機科學中,很多時候我們故意要把確定的東西變成隨機的,這種思維顯然和我們人類的思維不同。我們前幾天提到了查找和搜索需要用到這種方法,今天我們填上這個坑。另外,每個人都不知不覺地使用的信息加密,也離不開隨機化。我們今天說比特幣是安全的,其實也是靠隨機化來做保障。當然,我們還是從查找信息這件事說起。   我們前幾天講到有效地查找信息可以藉助索引這個工具。比如說我們要找李強的訊息,有了索引之後,計算機可以先在索引中找到李強的訊息所存放的位置,然後 […]

上一篇我們講到,比爾蓋茲對當時微軟的操作系統不能快速查找信息很不滿意,他的話大意是這樣的,我們的工程師要找一個文檔,打開計算機在本地查找,還沒有上網到 Google上查找快,以至於微軟內部的員工居然工作時離不開 Google。於是,在 Windows XP 之後,微軟下了大功夫開發新的具有強大的本機搜索功能的操作系統,代號 Vista。   在 Vista 推出以前,全世界對此寄予了厚望,以至於如果它的進展順利,不僅微軟的股票會漲,而且整機廠家和英特爾的股票也會隨之上漲。相反,只要微軟 […]

我們昨天講了人和計算機在查找一個目標時的一些共同之間,既會使用順序查找,也會使用類似字典查找那樣的二分查找。當然,使用後者需要對所有的數據先排序。無論是哪一種方法,在處理非常大量的數據時,都會顯得力不從心。   比如,我們要把北京市所有叫〝李強〞的人找出來,這件事就有點難辦。為什麼呢?因為叫李強的人太多了。研究發現全中國有兩百多萬個叫李強的人,超過人口的千分之一。按照這個比例,在北京市會有 3000 ~ 4000 個李強,把這麼多李強都找到,上面兩種方法就不大靈光了。   順 […]

我們要講的第一個概念就是Addressing。Addressing 這個詞沒有很達意的中文翻譯,單純翻譯成「編址」大家還是不明白,會問什麼叫做編址。其實,我倒覺得更簡單的一種講法是一一把所有的東西進行編號。這樣更為準確,也容易懂。在計算機裡面所有的東西都被編了號,這包括一個個的內存格子,筆記本電腦上那些在機殼兒上看得見的和看不見的接口, 計算機通過有線或者無線所連結的各種設備,它們都被編了號。對於這些編號,我們廣義地稱之為地址。   另外,計算機所見到的、處理了的信息,它所運行的指令, […]