信息物理——推荐算法篇

1. 推荐算法介绍

推荐算法早已无处不在,你以为你是在做你想做的事,实际上你只是在做别人想让你做的事。我们早已在推荐算法下无处遁形。本文粗略梳理了推荐算法的演化思路,不求做到算法技术上的全面和完整性,而更关注经典算法的发展和优化过程,试图能够从中获得算法创新的启发,以期提取出通用的算法创新思路。

2. 传统推荐算法

最简单的推荐方法,就是以产品受欢迎度来进行排序和推荐。这背后潜在的假设是:大众喜欢的东西新客户有大概率也会喜欢。即使到现在,很多场合我们也会下意识去用这种方法来进行选择。不过显然,这种方法的缺陷就是非个性化,无法做到结合喜好精准推荐。

个性化推荐则是利用用户的历史数据来对用户偏好进行推测,在大数据时代这也是必行之道。为了后续的计算,我们通常会把用户和产品看作一个二分网,连边是用户购买产品的历史记录。我们要做的是,通过这张二分网络,去推测用户ii接下去最有可能购买的商品α\alpha(或者排名),这本质上其实是一个二分网络的连边预测问题。

2.1 协同过滤(Collaborative Filtering)

协同过滤是最为经典的推荐算法,其思路就是同时考虑相似性购买关系。协同过滤也有两类,分别是基于用户的算法和基于商品的算法。

  • 基于用户的协同过滤算法,其前提假设是:用户会购买那些和他相似的用户,所购买的商品。用户ii对商品α\alpha的评分计算如下:
f~αi=j=1Nsijajα\tilde {f}^{i}_{\alpha} = \sum^{N}_{j=1} s_{ij}a_{j\alpha}

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享