机器学习—主要术语(整合版)

【摘要】 本文参考谷歌官网对机器学习术语的解释,进行总结并加以描述。

前言

本文参考谷歌官网对机器学习术语的解释,进行总结并加以描述。

什么是机器学习?简单来说,机器学习系统通过学习如何组合输入信息来对未见过的数据做出有用的预测。

 主要术语(基本)

主要包括标签、特征、样本、训练、模型、回归模型、分类模型、泛化、过拟合、预测、平稳性、训练集、验证集、测试集。

标签(label)

标签是我们要预测的事物,在分类任务中的类别,比如是猫或狗;简单线性回归中的y变量;。标签可以是小麦未来的价格、图片中显示的动物品种、音频剪辑的含义或任何实物。

在监督学习中,标签值是样本的“答案”或“结果”部分。

特征(feture)

在进行预测时使用的输入变量

特征是输入变量,即简单线性回归中的x变量;在分类任务中的输入图像特征。

简单的机器学习项目可能会使用单个特征,而比较复杂的机器学习项目可能会使用数百万个特征,按如下方式制定:x_{1},x_{2},.......x_{n},

在垃圾邮箱检测器示例中,特征可能包括:

  • 电子邮件文件中的字词
  • 发件人的地址
  • 发送电子邮件的时段
  • 电子邮箱包含“一些敏感词”

样本(example)

数据集的一行。在监督学习的样本中,一个样本既有特征,也有标签。在无监督学习的样本中,一个样本只有特征。

样本是指数据的特定示例:x。(x表示一个矢量)将样本分为以下两类:

  • 有标签样本
  • 无标签样本

有标签样本同时包含特征的标签,即:

labeled examples: {features, label}: (x, y)

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享