由貝葉斯 推匯出蒙提霍爾問題有兩個解答?求鹽選別瞎扯
最近看到
@鹽選推薦
推薦了一篇文章,稱蒙提霍爾問題是貝葉斯定理的悖論。根據模型不同,給出的解答也不同。個人不敢苟同。
https://www。
zhihu。com/question/1976
0244/answer/714210299?hb_wx_block=0
1。 首先解釋一下蒙提霍爾問題(三門問題)。
三個門A B C後面 只有一個門放著獎品。主持人讓你選。在你做完選擇後 (假設你選A),主持人開啟另外兩扇門中沒有獎品的那一扇門 (假設打開了B),這時候問你 你是堅持選 A還是換成C。
一種直覺的想法是 既然B門裡沒有獎品,那麼此時A C有獎品的機率皆為1/2。換或者不換 獲獎機率相同。
然而正確的解答是 應該換,因為當主持人開啟B門後,C門獎品的機率就從1/3更新為了2/3。這是比較反直覺的。我會在下文給出解釋。
但是 鹽選推薦的文章裡寫了一堆雲裡霧繞的東西 然後得出1/2和2/3這兩個解答都對,因此 蒙提霍爾問題是貝葉斯定理中的悖論。然而這種說法並不正確。我同樣會在下文給出解答。
2。 什麼是貝葉斯定理
簡單的講一下。貝葉斯定理是基於條件機率的。他描述在已知一定資訊和條件的情況下,對機率的計算。簡單地說 就是
由資訊去更新機率
。
舉個例子。在一無所知的情況下,問 皇馬下一場比賽 贏拜仁的機率是多少。由於你從來不看足球,因此對勝率的估計會是1/2。但是這時候給你一個歷史對戰記錄 假如拜仁已經連贏了皇馬10次,那此時就應當
更新對機率的計算
。如果你和朋友打賭 你應當賭拜仁贏球。 這就是對貝葉斯定理的 簡易版解釋。
3。 回到蒙提霍爾問題 (三門問題)的解答
當主持人開啟B門的那一剎那,A門和C門獲獎的機率應該
如何更新
?
我們可以透過一個逆向思想實驗來解答。假如你堅定不移地選A門,不管主持人開不開門 你都不做改變。那麼你的中獎率就是
1/3
,即你
一開始就選對門
的機率。因此可得 不堅持A門而換成C門的中獎率就是
2/3
。
換一個“貝葉斯方式”的解答。選擇A的中獎率是1/3,因此BC中有獎的機率是 2/3。由於你不管選擇哪一道門 主持人
總能找到一扇沒有獎品的門來開啟
。因此主持人開啟B門的時候 並不更新A門的獲獎機率(即不管開啟哪扇門,對A門是不是有獎,並沒有提供有用的資訊)。然而B門沒有獎,對C門是有用的資訊,因為當主持人開啟B門後,B門機率坍縮為0,而BC中有獎的機率仍為2/3,因此可得 C門中有獎的機率為2/3 。
如果仍然難以理解 那麼可以想象一個“千門問題”,或者說彩票問題。你在1-1000張彩票中隨便選一個,其中只有一個有大獎。你做完選擇後,主持人撕毀998張沒有獎的,留下最後一張。這時候你換不換?由於你本能地知道你一開始就選對的機率極低,因此 你會不假思索的換。
數學上,主持人撕毀998張的時候,剩下那一張的中獎率更新為了999/1000。也就是 除非你一開始就選對那千分之一,否則你就應該換。
4。對蒙提霍爾問題答案的反駁?
假設現在有三個人abc分別站在 ABC在個門前。此時 主持人宣佈 b沒有中獎。那此時a應不應該和c換?
如果我們相信了蒙提霍爾問題的解答 a應該要和c換。但是 你會發現c也是這麼想的。難道對於a來說 c更容易中獎,對於c來說 a更容易中獎?(別人的就是最好的?)
顯然不是。顯而易見 AC在數學上是等價的。因此A C中獎率都是
1/2
。
5。 所以蒙提霍爾問題有兩個解答嗎?
不是
。三門問題仍然是 1/3對2/3。
上文中提到的例子看似與三門問題等價,其實不然。
上面的例子,其實可以等價為: 我們假設有個觀眾在看上文的abc三人。當主持人宣佈b沒有中獎時,觀眾可以競猜 ac 中誰中獎。當然 猜對機率是1/2。
進一步變形, 上面所舉例子又和
下面這個例子等價
:在你做選擇之前,主持人
事先把B門開啟
,告訴你沒有獎。此時A 門和C門中獎率當然都是 1/2。
不難發現 這和三門問題有著本質的區別 因為三門問題要求你
先做出選擇
,主持人在
剩下兩個門裡
開一個沒有獎的。而上面的例子 主持人
先打開了門
。
這是似乎比較違反直覺的。這好像就是說 你
先做出選擇
還是 主持人
先開門
對你中獎機率有影響。
但是我們仍然能回到千門問題來解答這個反直覺的情況: 假設你選了1000張彩票中的一張,此時主持人摧毀了998張沒有中獎的彩票。還剩下一張。這時候走來一個
不明真相
的路人,主持人給他這張剩下的彩票,問你們兩個 要不要和對方互換。
對於你來說 你知道你自己最開始選的這一張大機率不中獎,而路人手裡的彩票 999/1000中獎。因此對你來說這是一個
千門問題
。你一定會選擇
換
(對應
先做選擇再開門
)。
但是對於路人來說 他只知道這兩張彩票中有一張是有獎的。由於他並不知道其中一張是你選出來的,而另一張是銷燬998張後剩下的,因此 他心裡想的是 換不換都無所謂 反正中獎率都是1/2。(對應
先開門再做選擇
)
因為 你比路人
多一個資訊
,即你知道有一張彩票是你選的,因此你對機率的計算 和 路人對機率的計算當然是不同的。這當然是符合貝葉斯定理的。
由此可見,雖然 “事先選擇” 這個行為會 改變中獎機率 看起來是反邏輯的,但是其實是有數學依據的,而且是完全符合貝葉斯定理的:
資訊更新機率
。
6。 順便提一下鹽選裡提到的 三個囚徒問題。
三個囚徒 A B C 中只有一個能被釋放。A問看守: “BC 裡反正至少有一個不能被釋放,你能告訴我一個名字 誰不能被釋放嗎?” 看守說B不能被釋放 (B心裡草泥馬了)。那麼此時A C被釋放機率是多少?
鹽選文章裡扯了一大堆 1/2 2/3 這個那個都沒說到點子上。三個囚徒的答案仍然是1/3對2/3。
留給大家去思考為什麼。一點小提示:由於是A去問守衛,所以 C的名字本可以被提到 但是沒有被守衛提到。因此 A C 並不對稱。且 C獲得了比A更多的資訊。想不明白就想想 千個囚徒問題,就可以明白了。
總結 : 蒙提霍爾問題不違反貝葉斯定理,由貝葉斯定理推倒不出矛盾。根據貝葉斯定理, 蒙提霍爾問題(三門問題,
先選擇再開門
)機率是 1/3對2/3。計算出 1/2的機率 本質上是與三門問題不同的 另一個問題(
即先開門再選擇
)。