1.2 Probability Theory(概率论)
模式识别领域的一个关键概念是不确定性。它是通过测量中的噪声以及数据集的有限大小产生的。概率论为不确定性的量化和处理提供了一个一致的框架,并形成了模式识别的核心基础之一。党羽第1.5节讨论的决策相结合时,它允许我们在所有可用信息的情况下做出最佳预测,即使这些信息可能不完整或不明确。
我们将通过一个简单的例子介绍概率论的基本概念。假设我们有两个盒子,一个红色和一个蓝色,在红色盒子里我们有2个苹果和6个桔子,在蓝色盒子里我们有3个苹果和一个桔子。这如图1.9所示。现在假设我们随机挑选其中一个盒子,然后从盒子中随机选择一种水果,观察他是哪种水果后,我们将其替换到它来自的盒子中。我们可以想象多次重复这个过程。让我们假设这样做,我们40%的时间选择红色盒子,60%的时间选择蓝色盒子,当我们从盒子里取出一个水果时,我们同样可能选择盒子里的任何一块水果。
figure 1.9 我们用一个简单的例子来介绍概率的基本概念,即两个颜色的盒子,每个盒子里都有水果(苹果显示为绿色,橙子显示为橙色)
在本例中,将选择的框的标识是一个随机变量,我们将用表示。该随机变量可以取两个可能值中的一个,即(对应于红色框)或(对应于蓝色框)。同样,水果的同一性也是一个随机变量,用表示。他可以采用(苹果)或(橙色)中的任意一个值。
首先,我们将事件发生的概率定义为事件发生的次数占总试验次数的分数,在总试验次数无限的限制下。因此,选择红色的概率为,选择蓝色框的概率为。我们将这些概率写成和。注意,根据定义,概率必须在区间内。此外,如果事件是互斥的,并且如果它们包括所有可能的结果(例如,在本例中,框必须是红色或蓝色),那么我们看到这些事件的概率总必须为1。
我们现在可以问这样的问题:”选择程序选择一个苹果的总概率是多少?“或者”如果我们选择一个橙色,那么我们选择的盒子是蓝色的概率是多少?“。一旦我们掌握了概率的两个基本规则,即总和规则和乘积规则,我们就可以回答这样的问题,甚至可以回答与模式识别问题相关的更复杂的问题。获得这些规则后,我们将回到我们的水果盒示例。
为了推导概率的规则,考虑图1.10中涉及两个随机变量和的更一般的例子(例如,可以是上面提到的方块和水果变量)。我们假设可以取任意一个值,其中,可以取值,其中。考虑总的个实验,我们对变量和进行取样,并让和为这样的实验的数目。同样,让取值(与取值无关)的实验次数用表示,同样,让取值的试验次数用表示。
figure 1.10 我们可以同故宫考虑两个随机变量来推导概率的和积规则,取值,其中,取值,其中在这个图解中,我们有和。如果我们考虑这些变量的实例的总数,则我们表示和通过的实例的数目,这是数组中对应单元中的点的数目。列中的点的数目,对应于,由表示,并且行中的点的数目,对应于,由表示。
取值和取值写的的值,成为和的联合概率。它是由在的点数作为点的总数的一部分,因此