阅读280 返回首页    go 阿里云 go 技术社区[云栖]


多重角度解读:贝叶斯推理是怎么工作的

首发地址:https://yq.aliyun.com/articles/64245

原文地址:https://brohrer.github.io/how_bayesian_inference_works.html

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

以下为译

 

贝叶斯推理是一种从数据中获得更清晰预测的方法,当没有足够多想要的数据时,并想获得这些数据全部的预测强度时,贝叶斯推理是特别有用的。

虽然贝叶斯推理有时候被描述得有些让人敬畏,但它既不是魔法也不神秘。尽管在数学公式上可以获得详细的解释,但其背后的概念是完全可以获得的。总之,贝叶斯推理允许你从数据中通过折叠已经知道的答案来作出更强的结论。

·托马斯··-

 321217e4f2839ca636ed828f96cf0d93e6ac29f8

现在考虑这个人在男卫生间排队情形的变化有了这个额外的部分信息,你可能会认为这是一个男。这种使用常识和背景知识是不需要思考就能得到的。贝叶斯推理是在数学上捕获这些常识与背景知识以致于使我们可以做出更准确的预测。

 a31840e95698765fe7840b7ec17a9a9e5ab3682f

数字电影困境,假设在剧院大约有一半男人一半女人。总共10050女性女性25一半(25短发。在男性中482252因此猜测电影持有者为的假设是安全的。

 da6dea4b1fd15486f261152195fef16627999229

假设有100排队其中是98陪伴伴侣2女性刚才的2名女性中长发短发各一人。男性长和短发的比例与之前一样,但是因为他们9894名是4名是。现在安全的赌注是票证持有者是一。这是基本贝叶斯推理原则的一个具体的例子。事先知道关键部分—— 电影票所有者在男子厕所外排队使我们能够更好地预测他们。

要讲清楚有关贝叶斯推理,下面四个概念:概率,条件概率,联合概率和边缘概率。

 4e3f855bdf6cbc1754c87f467b9d3f3b07259709

50

 4b77ca9780ef2b87f66d8f96a97307183fb2e723

男子厕所排队等候0.02的概率0.98的概率为男性。

 0e02e84cc7b9375ba45334eb6a6690503f35b383

名女性,她有长头发的概率是多少概率一样,但他们只是看的所有例子的一个子集—— ),假设她是个女性,其有长头发的概率是多少等于性有长头发的数量除以女性的总数。这会变为0.5不管我们是否考虑到男卫生间排队是在整个剧院。

 71b1560d2fd61d6f27cdc7663720d37c8b83bf49

P

 b63d1f9ebdcf3c860ac8d123a1f8c8b8b9dd879e

关于条件概率,PPP不同。如果我拿着的是一只小狗,它很可爱的概率是非常高的。如果我手里拿的东西是可爱的,是一只小狗的概率中等偏低,因为这也可能是小猫,兔子等。

 69ad13a53945ae1c7762ce5f41e0f8b0d15a94e2

 1311e170e638d77b377fff5efb5e027783d2713a

P排队情况下为0.04

 23f98b01ee1163c9af498693faa77fa31e685a93

条件概率不同PP是相同的即有牛奶和果冻甜甜圈的概率有果冻甜甜圈和牛奶的概率是相同的

 022ecf4c78f530f282780c18f21f48eaa30c8f2f

边缘概率为了解决这个问题,我们必须所有不同的方式的概率加起来,长头发男性加上长头发的女概率。加起来两个联合概率后概率P0.27,但在男卫生间排队情况下为0.05

P

·

820400fe3ee75c7832f4f9f28d5ae16bcb61a46a

P

 dd0032c381896f96c56ba6a261ad3a65f6be8611

使用一点代数知识P男性|这个问题

 293d546d27f79c3a81937bb413d6da947ff59821

A

 534541d2924a697f8bbc459bb6490d3bc518f15f

最后解决电影票困境必须贝叶斯定理应用到我们的问题

 ff7670b0d6dfd7acff8ded434908038869c0b571

P

 ba07c148d45e7246ac5b4aae6ea8cba112859074

P男性。使用这种先验知识,它更新了关于这种情况的信念。

设想下一壶咖啡刚好有足够位置来填充一杯的概率是多少。如果只有一个杯子,那么填补是没有任何问题的,但如果有一个以上的话,你必须决定如何分配这么多杯的咖啡。但是你喜欢的话,你可以把它分解,只要你把所有的咖啡倾倒进一个杯子或其他。在电影院,一个杯子可能代表一个女性,另外代表的是男性。

 9f2fb78983c8c47eb3367c191af4e00ee3d9c7bd

或者,我们可以采用四个杯子来代表性别和头发的长度的所有组合的分布。在这两种情况下,咖啡总量加到一个杯子里。

 c74c9a9dd564077041b6bc57fdcbe5a6d3daa941

通常情况下,我们设置这些杯子并排在一侧,并把咖啡量看成是一个柱状图。其分布显示了我们对这种情况信服的强度。

 391b34e8f0f938a36a939ce9676bfaf46db8de19

如果抛一枚硬币并隐藏结果,那么你的信念会被均匀分到头和尾巴之间。

 42a8ff39b3768ccbb26667541592dc1d06c03249

如果掷骰子并隐藏结果,那么你对顶部的数字的信念会均匀地分到六个面之间。

 76cedade3e163dd096f6ccc8ce0bec424bbdc8a7

—— 

cf44e614d166d9c79d68be28f9b884a8567f256e

150

 3f69370e45a7447b331fa964e56751c410c5f418

分布可以被分解成更细的等级,你可以看成是将少量咖啡分别倒入更多的杯子去获得更细的信念集。

 0c558991422b488e3f7fff687d329c2038965f71

最终,你需要虚杯的数量变得如此之大以致于这个类推被分解。在该点的分布是连续的。修改了下相关的数学知识,但基本思想仍然是有用的。它显示你的信念是如何分配的。

现在用概率分布描述,可以用贝叶斯定理来解释数据。

 63993f38930d4662ecc6d2fde480569dfb269818

 

由于狗大范围的扭动造成很难得到准确的体重读数,而得到一个准确的读数是很重要的,因为如果体重提升了,必须降低其进食量,反之亦然。

13.9

 5d7f538246d16e95e2226daa1c2d8f9ffe31f206

15.2时,通常是返回并收集更多的数据,但在某些情况下,这是不可行的或过于昂贵。

通过使用贝叶斯定理,这是使小数据集尽可能的有用。在我们应用它之前,是非常有必要重温下公式,并回顾各种术语。

 8d323edd417c69f98cb5e99ef52bac0083644f52

“w”

P

P

P

P

13

 255caffd18c9da819f30691a403e95c7df7a560e

14

虽然使用了贝叶斯定理,但还是没有接近一个有用的估计。为了解决这一问题,假设先验概率为不均匀。先验分布代表了我们在采取任何测量之前对某事的信念。一个统一的先验说明我们相信每一个可能的结果是等可能的,这是很少见的情况。

 ae530841752edc39ee5f7d97e74fb213a1b3234d

14.2

 7eeafd1f72a3442a19215ec933d0a73913e715e7

17

 1e471b1d49d1d23df014c9609a100e6f28d97c49

MAP

17.5

Pm)以反映这一点,这会改善我们后验概率的准确性。

狗的称重例子展示了贝叶斯推理的优点,但也有缺陷。通过对答案进行一些假设会改善我们的估计,但测量事物的整个目的是为了了解该事物。如果我们的假设已经知道了答案,那么可能会审查这些数据。

13

1000有很长的尾巴且从来不会完全变为零。

文章原标题《How Bayesian inference work》,作者:Brandon

翻译:海棠

最后更新:2017-07-12 22:06:27

  上一篇:go  间谍卫星的基础?YOLT——利用卷积神经网络对卫星影像进行多尺度目标检测(Part I)
  下一篇:go  百度Deep Voice详解分析:快速理解语音合成流程(Part I)