强化学习入门(1)

文章正文第一句:“这是我参与更文挑战的第3天,活动详情查看: 更文挑战

009.jpeg

如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和简书使用头像一致。

Deepmind 自从在围棋战胜了围棋世界冠军之后就开始着手让 AI 来玩更复杂游戏 starcraft。我想大家可能和一样对于 AI 能够玩游戏的项目是如何实现的非常感兴趣。兴趣归兴趣如果要实现一个这样项目还是具有挑战性,不过不管有多难,我们还是从基础做起一步一步。

010.png

概率基础知识

首先在开始之前简单地回归一下可能在本次分享中用到一些概率知识。

随机变量以及分布函数

首先函数自变量可以从实数扩展到例如自变量为两点,输出两点距离。用大写字母表示随机变量,而用小写来表示观测值。事件用于语言来描述样本集合,这些样本具有一定属性才聚集在一起

P(X=0)=0.5P(X=1)=0.5\begin{aligned} P(X=0) = 0.5\\ P(X=1) = 0.5\end{aligned}

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享