1.DIN模型

原理

  • 计算用户Last N向量的加权平均
  • 权重是候选物品与Last N物品的相似度

在这里插入图片描述

缺点

  • 注意力层的计算量正比于n(用户行为序列的长度)
  • 只能记录最近的几百个物品,否则计算量太大
  • 只关心短期兴趣,会遗忘长期兴趣

2.SIM模型

对长期兴趣建模

原理

  • 对用户长期行为记录,n大小可以是几千
  • 对于每个候选物品,在用户Last N记录中快速查找,找到k个相似物品
  • 把Last N变成TopK,然后输入注意力层
  • 计算量从n降到k

算法步骤

1.查找

在这里插入图片描述

2.注意力机制

对比DIN,user侧的LastN交互记录被换成了上一步查找到的TopK交互记录
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

参考文献

王树森推荐系统公开课-SIM模型
SIM论文
DIN论文

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐