(Page:12-17) 1.2 概率论

1.2 Probability Theory(概率论)

模式识别领域的一个关键概念是不确定性。它是通过测量中的噪声以及数据集的有限大小产生的。概率论为不确定性的量化和处理提供了一个一致的框架,并形成了模式识别的核心基础之一。党羽第1.5节讨论的决策相结合时,它允许我们在所有可用信息的情况下做出最佳预测,即使这些信息可能不完整或不明确。

  我们将通过一个简单的例子介绍概率论的基本概念。假设我们有两个盒子,一个红色和一个蓝色,在红色盒子里我们有2个苹果和6个桔子,在蓝色盒子里我们有3个苹果和一个桔子。这如图1.9所示。现在假设我们随机挑选其中一个盒子,然后从盒子中随机选择一种水果,观察他是哪种水果后,我们将其替换到它来自的盒子中。我们可以想象多次重复这个过程。让我们假设这样做,我们40%的时间选择红色盒子,60%的时间选择蓝色盒子,当我们从盒子里取出一个水果时,我们同样可能选择盒子里的任何一块水果。

figure 1.9 我们用一个简单的例子来介绍概率的基本概念,即两个颜色的盒子,每个盒子里都有水果(苹果显示为绿色,橙子显示为橙色)

figure_1.9.png

  在本例中,将选择的框的标识是一个随机变量,我们将用BB表示。该随机变量可以取两个可能值中的一个,即rr(对应于红色框)或bb(对应于蓝色框)。同样,水果的同一性也是一个随机变量,用FF表示。他可以采用aa(苹果)或oo(橙色)中的任意一个值。

  首先,我们将事件发生的概率定义为事件发生的次数占总试验次数的分数,在总试验次数无限的限制下。因此,选择红色的概率为4/104/10,选择蓝色框的概率为6/106/10。我们将这些概率写成p(B=r)=4/10p(B=r)=4/10p(B=b)=6/10p(B=b)=6/10。注意,根据定义,概率必须在区间[0,1][0,1]内。此外,如果事件是互斥的,并且如果它们包括所有可能的结果(例如,在本例中,框必须是红色或蓝色),那么我们看到这些事件的概率总必须为1。

  我们现在可以问这样的问题:”选择程序选择一个苹果的总概率是多少?“或者”如果我们选择一个橙色,那么我们选择的盒子是蓝色的概率是多少?“。一旦我们掌握了概率的两个基本规则,即总和规则和乘积规则,我们就可以回答这样的问题,甚至可以回答与模式识别问题相关的更复杂的问题。获得这些规则后,我们将回到我们的水果盒示例。

  为了推导概率的规则,考虑图1.10中涉及两个随机变量XXYY的更一般的例子(例如,可以是上面提到的方块和水果变量)。我们假设XX可以取任意一个值xix_i,其中i=1,...,Mi=1,…,MYY可以取值yjy_j,其中j=1,...,Lj=1,…,L。考虑总的NN个实验,我们对变量XXYY进行取样,并让X=xiX=x_iY=yjY=y_jnijn_{ij}这样的实验的数目。同样,让XX取值xix_i(与YY取值无关)的实验次数用cic_i表示,同样,让YY取值yjy_j的试验次数用rjr_j表示。

figure 1.10 我们可以同故宫考虑两个随机变量XX来推导概率的和积规则,XX取值{xi}\{x_i\},其中i=1,...,Mi=1,…,MYY取值{yj}\{y_j\},其中j=1,...,Lj=1,…,L在这个图解中,我们有M=5M=5L=3L=3。如果我们考虑这些变量的实例的总数NN,则我们表示X=xiX=x_iY=yjY=y_j通过nijn_{ij}的实例的数目,这是数组中对应单元中的点的数目。列ii中的点的数目,对应于X=xiX=x_i,由cic_i表示,并且行jj中的点的数目,对应于Y=yjY=y_j,由RjR_j表示。

figure_1_10.png

  XX取值xix_iYY取值yjy_j写的p(X=xi,Y=yj)p(X=x_i,Y=y_j)的值,成为X=xiX=x_iY=yiY=y_i的联合概率。它是由在i,ji,j的点数作为点的总数的一部分,因此

p(X=xi,Y=yj)=nijN(1.5)p(X=x_i,Y=y_j)=\frac{n_{ij}}{N}\tag{1.5}

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享