深度学习系列一: 神经网络

【摘要】 神经网络,是一种机器学习算法(一类数学模型),是人工智能的一个分支,它的灵感来源于大脑的网状神经元和神经元的连接结构。下图是一个感知器 (Perceptron,神经元的一种,其它的还有sigmoid和ReLU),输入是  。此处x的数量可以为j,输出为0或1。当全部的x一起输入时,产生输出y(x类比机器学习中特征或已知条件,y类比标签或结果)。单一感知器上述感知器可以用以下数学模型表示:当j…

神经网络,是一种机器学习算法(一类数学模型),是人工智能的一个分支,它的灵感来源于大脑的网状神经元和神经元的连接结构。下图是一个感知器 (Perceptron,神经元的一种,其它的还有sigmoid和ReLU),输入是[公式]。此处x的数量可以为j,输出为0或1。当全部的x一起输入时,产生输出y(x类比机器学习中特征或已知条件,y类比标签或结果)。

单一感知器

上述感知器可以用以下数学模型表示:

当j个w*x相加的和小于等于一个阈值时,输出为0,反之为1。

每个x和它的权值w (weight) 相乘然后累加求和,最终得出的结果和阈值 (threshold) 比较,当满足一定条件时输出0或者1。从这里我们可以做一个小的总结或者说是联想:“如果已知全部的x和对应的输出结果,如何求解全部的w呢?如果通过某种方法获得了全部的w,那么如果给一个未知的x,是否会输出准确的结果呢?”。这个问题的答案是肯定的,这也是一切机器学习能够成型的本质,即:已知公式 y=wx+b,其中x是输入,y是结果,w和b是权值。当我们有足够多的数据对(x和y)时,我们可以通过特定的一些方法近似求得w和b,一旦我们求解出w和b,我们就可以对未知的x进行求y的操作(x在现实中是一组条件,y是预测的结果)。在上面的例子里,我们可以通过给定的输出和x的值来求解w,求解的过程即为训练 (train)。当训练完成后,给定任意的x,都可以产生一个输出y ,这个过程叫做预测(predict)。同理,我们可以做出一个假设:一个感知器模型可以做出简单的预测,那么当我们增加神经节的数量后,应该可以处理更为复杂的问题。多层神经网络理论上可以解决任何的分类问题。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享