机器学习 第十章降维与度量学习

关于周志华老师的《机器学习》这本书的学习笔记
记录学习过程
本博客记录Chapter10

1 kk邻近学习

kk近邻(kk-Nearest Neighbor, KNN)学习是一种常用的监督学习方法。其基本思想是:给定测试样本,基于某种距离度量找到与其最靠近的kk个训练样本,根据这kk个邻居的信息来进行预测。其中,分类问题往往采用“投票法”;回归问题采用“平均法”。 其示意图如下:

image.png

kk-近邻分类器没有显式的训练过程,训练过程仅需要将样本保存起来,待收到测试样本后再进行处理,是典型的“懒惰训练”(lazy learning)。该方法的核心是确定kk,当k=1k=1,其又叫做“最近邻分类器”。

给定测试样本xx,若其最近邻样本为zz,则最近邻分类器出错的概率是xxzz标记不相同的概率:

P(err)=1cYP(cx)P(cz)P(err)=1-\sum_{c\in Y} P(c|x)P(c|z)

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享