推荐系统学习笔记之三 LFM (Latent Factor Model) 隐因子模型 + SVD (singular value decomposition) 奇异值分解

Low Rank Matrix Factorization低阶矩阵分解在上一篇笔记之二里面说到我们有五部电影，以及四位用户，每个用户对电影的评分如下，？表示未评分。Movies\UserUser 1User 2User 3User 4Movie 15500Movie 25？？0...

小鹅鹅

16212人浏览 · 2017-10-19 23:14:13

小鹅鹅 · 2017-10-19 23:14:13 发布

Low Rank Matrix Factorization低阶矩阵分解

在上一篇笔记之二里面说到我们有五部电影，以及四位用户，每个用户对电影的评分如下，？表示未评分。

Movies\User	User 1	User 2	User 3	User 4
Movie 1	5	5	0	0
Movie 2	5	？	？	0
Movie 3	？	4	0	？
Movie 4	0	0	5	4
Movie 5	0	0	5	？

那么我们可以把第一个表格里的内容转化成一个矩阵R：

R = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ 55 ? 00 5 ? 400 0 ? 055 00 ? 40 ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

X = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ - - - (x (1)) T - - - - - - (x (2)) T - - - . . . - - - (x (n m)) T - - - ⎤ ⎦ ⎥ ⎥ ⎥ ⎥

Θ = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ - - - (θ (1)) T - - - - - - (θ (2)) T - - - . . . - - - (θ (n u)) T - - - ⎤ ⎦ ⎥ ⎥ ⎥ ⎥

R=ΘTX R = Θ T X <script type="math/tex" id="MathJax-Element-32">R =\Theta^{T}X</script>，这种方法被称为：低秩矩阵分解（Low Rank Matrix Factorization）。

相关应用：

找电影i相似的电影j：可以计算 ‖‖x(i)−x(j)‖‖ <script type="math/tex" id="MathJax-Element-33">\left \| x^{(i)} - x^{(j)} \right \|</script>两个特征向量的距离，其中距离最小的就是最相似的电影。

LFM (Latent Factor Model) 隐因子模型

接下来引申到LFM (Latent Factor Model) 隐因子模型，其中隐因子可以理解为一个用户喜欢一个电影的隐形原因，比如电影里面有他喜欢的romantic和action元素，还有他喜欢的某个演员或者导演编剧。如果另外一个电影有类似的元素跟演员，那么他很有可能会也喜欢这部电影。LFM的核心思路就是求出用户的θ向量和电影的x向量。
在评分矩阵 Rm,n <script type="math/tex" id="MathJax-Element-34">R_{m,n}</script>中，LFM中认为评分矩阵可以表示为 Rm,n=Pm,F⋅QF,n <script type="math/tex" id="MathJax-Element-35">R_{m,n}=P_{m,F}\cdot{Q_{F,n}}</script>即两个矩阵的乘积，其中F为隐因子的个数。我们设 r̂ ui <script type="math/tex" id="MathJax-Element-36">\hat {r}_{ui}</script>为用户u对物品i的评分。

r ̂ u i = \sum f = 1 F P u f Q f i

r̂ ui r ^ u i <script type="math/tex" id="MathJax-Element-38">\hat {r}_{ui}</script>与

rui r u i <script type="math/tex" id="MathJax-Element-39">{r}_{ui}</script>之间的差距，并且为了防止过拟合加入了正则项。

m i n : C o s t F u n c t i o n J = \sum r u i \neq 0 (r u, i - r ̂ u i) 2 + λ (\sum P 2 u f + \sum Q 2 f i)

\partial J \partial P ( t ) u f = \sum i, r u i \neq 0 - 2 (r u, i - r ̂ u i) Q (t) f i + 2 λ P (t) u f

\partial J \partial Q ( t ) f i = \sum u, r u i \neq 0 - 2 (r u, i - r ̂ u i) P (t) u f + 2 λ Q (t) f i

SVD (singular value decomposition) 奇异值分解

SVD的数学意义和理解可以参考这篇博客

这里的SVD推荐本质上是model-based，跟传统数学意义的SVD没有太大关系，只不过借鉴了SVD分解 R=U∗S∗V <script type="math/tex" id="MathJax-Element-43">R=U∗S∗V</script>这个形式，通过最优化方法进行模型拟合，求得 R=U∗V <script type="math/tex" id="MathJax-Element-44">R=U∗V</script>。

我们在刚刚上面提到的 r̂ ui <script type="math/tex" id="MathJax-Element-45">\hat{r}_{ui}</script>中加入偏置项：

r ̂ u i = \sum f = 1 F P u f Q f i + μ + b u + b i

bu b u <script type="math/tex" id="MathJax-Element-47">b_u</script>是用户偏置项，表示一个用户评分的平均值。

bi b i <script type="math/tex" id="MathJax-Element-48">b_i</script>是物品偏置项，表示一个物品被评分的平均值。偏置项是固有属性，每个用户和物品都有自己的值，代表该物品是否被大众喜爱程度或某个用户对物品苛刻程度。
带偏置的LFM又被称为SVD。加入偏置项之后我们可以得到新的代价函数：

J = \sum r u i \neq 0 (r u, i - r ̂ u i) 2 + λ (\sum P 2 u f + \sum Q 2 f i + \sum b 2 u + \sum b 2 i)

b (t + 1) u : = b (t) u + α * (r u, i - r ̂ u i - λ * b (t) u)

b (t + 1) i : = b (t) i + α * (r u, i - r ̂ u i - λ * b (t) i)

SVD++ / TIME SVD ++

我们从上一步的BiasLFM(即SVD)继续演化就可以得到SVD++。
SVD++：User对Item i 有评分，则反映他对各个隐因子的喜好程度 yi=(yi1,yi2,...,yiF) <script type="math/tex" id="MathJax-Element-57">y_i=(y_{i1},y_{i2},...,y_{iF})</script>，是物品所携带的属性。

r ̂ u i = \sum f = 1 F (P u f + \sum j \in N ( u ) Y j f | N ( u ) | ‾ ‾ ‾ ‾ ‾ ‾ \sqrt) Q f i + μ + b u + b i

Nu N u <script type="math/tex" id="MathJax-Element-59">N_u</script>为User u 评价过的物品集合。
使用随机梯度下降可以求得Q与Y的偏导

\partial r u i ^ \partial Q f i = P u f + \sum j \in N ( u ) Y j f | N ( u ) | ‾ ‾ ‾ ‾ ‾ ‾ \sqrt

\partial r u i ^ \partial Y j f = Q f i | N ( u ) | ‾ ‾ ‾ ‾ ‾ ‾ \sqrt

矩阵分解优劣势

主要的优势如下：

比较容易编程实现，随机梯度下降方法依次迭代即可训练出模型。
预测的精度比较高，预测准确率要高于基于领域的协同过滤以及基于内容CBR等方法。
比较低的时间和空间复杂度，高维矩阵映射为两个低维矩阵节省了存储空间，训练过程比较费时，但是可以离线完成；评分预测一般在线计算，直接使用离线训练得到的参数，可以实时推荐。
非常好的扩展性，如由SVD拓展而来的SVD++和 TIME SVD++。

矩阵分解的不足主要有：

训练模型较为费时。
推荐结果不具有很好的可解释性，无法用现实概念给分解出来的用户和物品矩阵的每个维度命名，只能理解为潜在语义空间。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Gemini 绘图国内怎么用？小镜AI开放平台极速接入指南，简单、稳定、低至 0.2 刀

2048 AI社区

震惊！AI教父Hinton最新爆料：未来十年AI将接管编程世界？小白程序员必看生存指南！

12月22日，诺奖得主、AI 教父 Geoffrey Hinton 接受了《经济学人》的访谈。本次对话阐述了他对智能本质的最新思考，深入探讨了AI 在医疗、教育及科研领域的愿景，Scaling Law 的极限突破、LLM 的推理本质、机器人具身智能的必要性，以及大脑与硅基智能在“快速权重（Fast Weights）”机制上的差异等话题。Hinton 指出，AI 不再是简单的工具，而是能够通过自我推