閱讀280 返回首頁    go 阿裏雲 go 技術社區[雲棲]


多重角度解讀:貝葉斯推理是怎麼工作的

首發地址:https://yq.aliyun.com/articles/64245

原文地址:https://brohrer.github.io/how_bayesian_inference_works.html

本文由北郵@愛可可-愛生活 老師推薦,阿裏雲雲棲社區組織翻譯。

以下為譯

 

貝葉斯推理是一種從數據中獲得更清晰預測的方法,當沒有足夠多想要的數據時,並想獲得這些數據全部的預測強度時,貝葉斯推理是特別有用的。

雖然貝葉斯推理有時候被描述得有些讓人敬畏,但它既不是魔法也不神秘。盡管在數學公式上可以獲得詳細的解釋,但其背後的概念是完全可以獲得的。總之,貝葉斯推理允許你從數據中通過折疊已經知道的答案來作出更強的結論。

·托馬斯··-

 321217e4f2839ca636ed828f96cf0d93e6ac29f8

現在考慮這個人在男衛生間排隊情形的變化有了這個額外的部分信息,你可能會認為這是一個男。這種使用常識和背景知識是不需要思考就能得到的。貝葉斯推理是在數學上捕獲這些常識與背景知識以致於使我們可以做出更準確的預測。

 a31840e95698765fe7840b7ec17a9a9e5ab3682f

數字電影困境,假設在劇院大約有一半男人一半女人。總共10050女性女性25一半(25短發。在男性中482252因此猜測電影持有者為的假設是安全的。

 da6dea4b1fd15486f261152195fef16627999229

假設有100排隊其中是98陪伴伴侶2女性剛才的2名女性中長發短發各一人。男性長和短發的比例與之前一樣,但是因為他們9894名是4名是。現在安全的賭注是票證持有者是一。這是基本貝葉斯推理原則的一個具體的例子。事先知道關鍵部分—— 電影票所有者在男子廁所外排隊使我們能夠更好地預測他們。

要講清楚有關貝葉斯推理,下麵四個概念:概率,條件概率,聯合概率和邊緣概率。

 4e3f855bdf6cbc1754c87f467b9d3f3b07259709

50

 4b77ca9780ef2b87f66d8f96a97307183fb2e723

男子廁所排隊等候0.02的概率0.98的概率為男性。

 0e02e84cc7b9375ba45334eb6a6690503f35b383

名女性,她有長頭發的概率是多少概率一樣,但他們隻是看的所有例子的一個子集—— ),假設她是個女性,其有長頭發的概率是多少等於性有長頭發的數量除以女性的總數。這會變為0.5不管我們是否考慮到男衛生間排隊是在整個劇院。

 71b1560d2fd61d6f27cdc7663720d37c8b83bf49

P

 b63d1f9ebdcf3c860ac8d123a1f8c8b8b9dd879e

關於條件概率,PPP不同。如果我拿著的是一隻小狗,它很可愛的概率是非常高的。如果我手裏拿的東西是可愛的,是一隻小狗的概率中等偏低,因為這也可能是小貓,兔子等。

 69ad13a53945ae1c7762ce5f41e0f8b0d15a94e2

 1311e170e638d77b377fff5efb5e027783d2713a

P排隊情況下為0.04

 23f98b01ee1163c9af498693faa77fa31e685a93

條件概率不同PP是相同的即有牛奶和果凍甜甜圈的概率有果凍甜甜圈和牛奶的概率是相同的

 022ecf4c78f530f282780c18f21f48eaa30c8f2f

邊緣概率為了解決這個問題,我們必須所有不同的方式的概率加起來,長頭發男性加上長頭發的女概率。加起來兩個聯合概率後概率P0.27,但在男衛生間排隊情況下為0.05

P

·

820400fe3ee75c7832f4f9f28d5ae16bcb61a46a

P

 dd0032c381896f96c56ba6a261ad3a65f6be8611

使用一點代數知識P男性|這個問題

 293d546d27f79c3a81937bb413d6da947ff59821

A

 534541d2924a697f8bbc459bb6490d3bc518f15f

最後解決電影票困境必須貝葉斯定理應用到我們的問題

 ff7670b0d6dfd7acff8ded434908038869c0b571

P

 ba07c148d45e7246ac5b4aae6ea8cba112859074

P男性。使用這種先驗知識,它更新了關於這種情況的信念。

設想下一壺咖啡剛好有足夠位置來填充一杯的概率是多少。如果隻有一個杯子,那麼填補是沒有任何問題的,但如果有一個以上的話,你必須決定如何分配這麼多杯的咖啡。但是你喜歡的話,你可以把它分解,隻要你把所有的咖啡傾倒進一個杯子或其他。在電影院,一個杯子可能代表一個女性,另外代表的是男性。

 9f2fb78983c8c47eb3367c191af4e00ee3d9c7bd

或者,我們可以采用四個杯子來代表性別和頭發的長度的所有組合的分布。在這兩種情況下,咖啡總量加到一個杯子裏。

 c74c9a9dd564077041b6bc57fdcbe5a6d3daa941

通常情況下,我們設置這些杯子並排在一側,並把咖啡量看成是一個柱狀圖。其分布顯示了我們對這種情況信服的強度。

 391b34e8f0f938a36a939ce9676bfaf46db8de19

如果拋一枚硬幣並隱藏結果,那麼你的信念會被均勻分到頭和尾巴之間。

 42a8ff39b3768ccbb26667541592dc1d06c03249

如果擲骰子並隱藏結果,那麼你對頂部的數字的信念會均勻地分到六個麵之間。

 76cedade3e163dd096f6ccc8ce0bec424bbdc8a7

—— 

cf44e614d166d9c79d68be28f9b884a8567f256e

150

 3f69370e45a7447b331fa964e56751c410c5f418

分布可以被分解成更細的等級,你可以看成是將少量咖啡分別倒入更多的杯子去獲得更細的信念集。

 0c558991422b488e3f7fff687d329c2038965f71

最終,你需要虛杯的數量變得如此之大以致於這個類推被分解。在該點的分布是連續的。修改了下相關的數學知識,但基本思想仍然是有用的。它顯示你的信念是如何分配的。

現在用概率分布描述,可以用貝葉斯定理來解釋數據。

 63993f38930d4662ecc6d2fde480569dfb269818

 

由於狗大範圍的扭動造成很難得到準確的體重讀數,而得到一個準確的讀數是很重要的,因為如果體重提升了,必須降低其進食量,反之亦然。

13.9

 5d7f538246d16e95e2226daa1c2d8f9ffe31f206

15.2時,通常是返回並收集更多的數據,但在某些情況下,這是不可行的或過於昂貴。

通過使用貝葉斯定理,這是使小數據集盡可能的有用。在我們應用它之前,是非常有必要重溫下公式,並回顧各種術語。

 8d323edd417c69f98cb5e99ef52bac0083644f52

“w”

P

P

P

P

13

 255caffd18c9da819f30691a403e95c7df7a560e

14

雖然使用了貝葉斯定理,但還是沒有接近一個有用的估計。為了解決這一問題,假設先驗概率為不均勻。先驗分布代表了我們在采取任何測量之前對某事的信念。一個統一的先驗說明我們相信每一個可能的結果是等可能的,這是很少見的情況。

 ae530841752edc39ee5f7d97e74fb213a1b3234d

14.2

 7eeafd1f72a3442a19215ec933d0a73913e715e7

17

 1e471b1d49d1d23df014c9609a100e6f28d97c49

MAP

17.5

Pm)以反映這一點,這會改善我們後驗概率的準確性。

狗的稱重例子展示了貝葉斯推理的優點,但也有缺陷。通過對答案進行一些假設會改善我們的估計,但測量事物的整個目的是為了了解該事物。如果我們的假設已經知道了答案,那麼可能會審查這些數據。

13

1000有很長的尾巴且從來不會完全變為零。

文章原標題《How Bayesian inference work》,作者:Brandon

翻譯:海棠

最後更新:2017-07-12 22:06:27

  上一篇:go  間諜衛星的基礎?YOLT——利用卷積神經網絡對衛星影像進行多尺度目標檢測(Part I)
  下一篇:go  百度Deep Voice詳解分析:快速理解語音合成流程(Part I)