概述
贝叶斯分析是整个机器学习的基础框架
中学课本里说概率这个东西表述是一件事情发生的频率, 或者说这叫做客观概率。
贝叶斯框架下的概率理论确从另一个角度给我们展开了答案, 它认为概率是我们个人的一个主观概念, 表明我们对某个事物发生的相信程度。
先验概率和后验概率
也可以叫正向概率和逆向概率。
先验概率就是不加条件(信息)的判断一件事发生的概率。比如你是否聪明的概率。你是否患病的概率。
后验概率是在附加了某条件后判断一件事发生的概率(是一种条件概率)。这个条件可以是已知另一个事件的发生,附加的条件对我们对判断前一个事件而言相当于新的信息,借此可作出更可靠的判断,从而实现从先验概率prior到后验概率posterior的改变。
比如已知你考上了大学,此时再判断你是否聪明的概率也变了。已知你检测呈阳性,此时再判断你是否患病的概率也变了。
注意这一点理解思维非常重要
贝叶斯公式的理解
为先验概率,为后验概率·,为条件概率,这三者即是贝叶斯统计的三要素。
先验概率
先验概率在贝叶斯统计中具有重要意义,首先先验概率即我们在取得证据之前所指定的概率, 这个值通常是根据我们之前的常识,带有一定的主观色彩。
有一个非常有趣的现象是如果我们的先验概率审定为或(即肯定或否定某件事发生), 那么无论我们如何增加证据你也依然得到同样的条件概率( ) 这告诉我们的第一个经验就是不要过早的下论断,很多时候我们都是在忽略后验概率的作用
后验概率
后验概率往往是当前的突发事件,同样需要纳入考虑范围。
条件概率
表示在A发生的前提下,B发生的概率,是以A事件100%发生来计算AB同时发生的概率。
要与加以区别,表示AB同时发生的概率,是以全体事件为100%来计算其中AB同时发生的概率。
贝叶斯定理的意义
如果你太注重特例(即忽视先验概率) 很有可能会误把噪声看做信号,而如果恪守先验概率忽视后验概率, 就成为无视变化而墨守成规的人。贝叶斯定理告诉我们要综合看待这二者。
数学角度的理解
上面的通俗理解,简单来讲,就是对于一个已知事件B发生了,去探究某一原因导致这一结果发生的概率,一定要考虑到所有的可能情况。
贝叶斯公式全盘考虑了这一原因占总原因的比例
分子为这一原因,分母为总原因。
[贝叶斯共识理解](