您當前的位置:首頁 > 文化

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

作者:由 Sharon 發表于 文化時間:2017-09-15

在詳細介紹什麼是貝葉斯,貝葉斯有什麼用等等之前,基於系列第一篇(為什麼心理學可以是科學:p<0。005>?),有人指出了幾點我認為值得說明一下。

其一

,可重複性

對於科學或者心理學來說,的確不是to be or not to be的決定性因素,但不可否認的是,對於任何學科,包括心理學,要想在學術界或者科學界挺起腰板(其實也是心理學家的責任和義務),我們對

可重複性危機(replication crisis)

必須要認真對待和解決(這裡推一下

Open Science 開放科學

,詳情關注專欄:Center for Open Science非官方部落格)。

其二,

p值是工具,

只要用工具的人真正瞭解工具的用途,清楚工具的有限(比如p值邏輯上的硬傷,稍後會說),正確使用工具,那就沒有問題。但是不少情況下,

心理學學者會錯誤、盲目使用p值,導致心理學科學研究不進反退

因此

解決可重複性危機的重要方法之一就是糾正心理學家使用p值的方法

。第二個方法,也就是這篇的重點:

推廣貝葉斯的應用

。為什麼呢?

因為在我看來,

科學的本質在於推動知識的發展

,而心理學家需要推動我們對

人類心理、認知、甚至人腦知識的發展,縮小我們目前的理解和真理(如果存在)之間的差距。

那麼,歷史以來我們是如何獲取知識呢?

我們做的就是收集資料(data),從資料推導結論,進化知識

。柯南說過,

真相只有一個

。但是,

從資料到結論,卻如去羅馬的路,不止一條

。第一篇文章介紹的p值就是一條路,而這一篇介紹的就是另外一條:

貝葉斯/ Bayes/ Bayesian。這條路更穩更快

回顧p值

我認為最好理解貝葉斯的方式就是從我們上次說的p值開始。

好吧,我又要問你了,什麼是p值啊?

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

來,跟著我讀一遍,

p值是:假設效應並不存在(null effect),你的資料+你有可能收集到但是沒收集到的更加極端的資料(long run/ fequentists)的機率。

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

所以,

p值並不能告訴你,一個理論存在與否的機率,而只能告訴你,在這個理論是錯的前提下,你的資料+你有可能收集到但是沒收集到的更加極端的資料(long run/ fequentists)的機率。

也就是說,

p值並不可以從根本意義上進化知識

(雖然p值還有很多其他問題,例如-H下低機率的資料也有可能在H下低機率等,這裡不一一細談。)

因此,既然我們想要進化知識,p值並不是我們想要的。

我們想要是,根據我手頭上收集到的資料X,我的理論正確的機率

,也就是:

P(H|X)。

套用牛頓的例子,就是,在牛頓被蘋果砸了那麼多次的前提下(資料/ Data),重力存在(理論/ H)的機率是多少。

我們該如何得到它呢?你猜的沒錯,就是

貝葉斯定理

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

貝葉斯/ Bayes/ Bayesian

理所當然,貝葉斯定理來自一個叫做貝葉斯Bayes的人。

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

根據基礎機率論知識,我們想要的

P(H|X)

其實就是

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

此可推導為:

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

(也就是本文封面那張圖上的公式)

整個公式由四個部分組成,

事前機率/ prior,當前可能性/ likelihood,證據/evidence (marginal likelihood),以及事後機率/ posterior

先說

事前機率/ prior: P(H) —— 在收集資料之前,你認為的你的假設理論的存在的機率

比如,在牛頓的例子中,P(H)就是牛頓在被蘋果砸之前,心裡認為的重力存在機率的機率。

當前可能性/ likelihood:P(X|H)

——

在一個理論存在情況下,資料的機率。

P(X|-H)

便是在一個理論不存在的情況下資料的機率,即

p值

證據/Evidence (marginal likelihood): P(D) —— 收集到這批資料的機率

(它的計算比較複雜,目前實踐上我們最常用的就是MCMC來實現,在此文中暫時不多提)

最後最重要的

事後機率/ posterior,它就是進化知識的重要一環,它就是我們想要的。

它代表的是,

在收集資料之後,你認為的你的假設理論的存在的機率

貝葉斯理論的精粹就在於,它完全而且完美的運用了你對一個理論的信念(prior belief)和你收集的資料(data或likelihood),從中得出結論(posterior belief),告訴你這個理論存在的機率或者這個理論模型引數的分佈。這也是貝葉斯最大的優勢——它完全符合我們做科學研究的邏輯和目的,我們想要的就是透過觀察、收集資料,來更新我們對某一理論的認識和信念(belief)。

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

說到這裡或許你會有點糊塗,不要緊,接下來我用一個有趣的例子向你展示貝葉斯的魅力。

貝葉斯和投籃命中率

為了激起大家濃厚的興趣,也為了激起本人濃厚興趣,我們就別用扔硬幣的例子了。我們用貝葉斯定理來探討一個有關籃球的問題。

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

NBA某個球員在某場比賽中投籃命中率是 20中10,然後我問你,這個球員投籃準不準?

首先,由於我們並不知道這個球員是誰,所以我們對他投籃準不準持

中立態度

,他有可能投籃超級爛,也有可能變態準,因此我們的

事前機率/ prior

的分佈就是一個

uniform distribution

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

此圖中,x軸是各種有可能的模型(命中率在0到之間),而y軸是各種模型對應的可能性。

接下來,基於我們收集到的資料,我們可以得到

當前可能性/ likelihood

的分佈是:

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

通常資料和模型引數分佈決定著likelihood的分佈。

最後,由prior和likelihood,我們可以愉快的得到

事後機率/ posterior

的分佈:

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

唔,這個時候會發現,為什麼posterior和likelihood長得一模一樣?!因為你的prior是中立的啊!

如果你對一個理論是否成立(這個球員準不準)毫無把握,你持有中立態度,那麼實驗得出來的結論就完全由資料控制。相反的,倘若你的prior是有傾向的,那麼posterior將同時被事前概念和資料掌控。

好吧,這個時候我該告訴你,

剛剛那個資料是2016-2017賽季總決賽最後一場庫裡的資料

(NBA中國官方網站 )

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

這時候,你的

prior

(至少我的prior)

就會變成這樣子:

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

根據庫裡變態準的名聲,我會覺得它的命中率一定很好,所以小於50%的命中率我都覺得不可能,於是都是0,而隨著x軸從0。5到1,我認為相對應的機率會變大。

但是,由於資料沒有變,

當前可能性/ likelihood

的分佈也不會變(

data is data

):

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

最後,

事後機率/ posterior

的分佈是:

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

雖然

我的prior有點過分了,但是由於資料和likelihood的存在,我的posterior還是稍微被扭轉過來了

,庫裡的命中率有點靠近50%。但是由於我的prior堅信庫裡命中率不可能低於50%,我的posterior的左邊被砍了一半。這個就是

貝葉斯定理的優勢之一,結論是來自對資料和事前機率的充分考慮

但是,只根據一場的資料我們下結論會不會太倉促。那麼,接下來我們來看看整個季後賽庫裡的資料,我們可以體會

貝葉斯定理的第二個優勢,隨著樣本量變大,資料對結論的控制力會越來越大(prior的影響相對變小)

(但是這不代表樣本量越大的實驗越好)

在2016-2017賽季季後賽,庫裡的命中率是312投151中 (NBA。com/Stats | Season Leaders )。

一樣的,我覺得庫裡變態準,於是有著變態的prior。

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

Frequentist vs Bayesian 2 之 不,是你的貝葉斯

當輸入庫裡整個季後賽的資料,而不只是一場的資料,我對庫裡命中率的近乎不合理的prior似乎不再那麼重要了,posterior接近50%,更加像likelihood。

不,是你的貝葉斯

p值等經典資料分析方法從邏輯上有很大的漏洞

。但這不代表p值就應該完全被否定。就像我在文章一開頭就說的,p值和貝葉斯都只是工具。但是,貝葉斯在正確使用的情況下,是完美的。它就是

進化科學最有力的武器,是去羅馬的最穩最快的道路

貝葉斯不僅可以讓我們表達我們的prior,收集資料不受動機影響(data is data),而且它還可以量化和觀察資料對posterior的影響

。在一眾認知科學家的倡議下(Wagenmakers et al, 2017(1); Wagenmakers et al, 2017(2)), 它在資料分析上的顯著優勢慢慢為人認識。Etz & Vanderkerckhove (2016) 也用了Bayes Factor來重新審視心理學重複性實驗大專案。

我並不提倡完全摒棄p值或Frequentist Statistics, 但是我衷心希望所有做心理,做科學的人懂得好好運用貝葉斯。

不,是你的貝葉斯。

SC

2017年9月15日。

標簽: 貝葉斯  prior  機率  資料  likelihood