京东商品可解释推荐系统

SASRec + MLP 融合行为序列与商品属性 | 三模型对比实验

实验图表

模型对比 训练损失

SASRec + MLP 核心模型

融合用户行为序列建模与商品多源属性编码的推荐模型:

  • SASRec 序列编码器:使用多层自注意力机制(Transformer Decoder)捕捉用户兴趣的时序演化,输出用户表征向量
  • 商品 ID Embedding:与 SASRec 共享的 Embedding 层,编码协同过滤信号
  • 属性 MLP:将品类、品牌、a1-a3 等离散属性通过独立 Embedding 编码,连同评论数等连续特征投影到统一空间
  • 融合方式:商品表征 = ID Embedding + 属性投影,兼顾行为信号与内容语义
  • 训练策略:Sampled Softmax,梯度同时流过用户侧和商品侧

对比基线

  • Item-CF:基于物品共现的协同过滤,统计商品在用户序列中的共现频率,用余弦相似度推荐相似商品
  • GRU4Rec:基于 GRU 的序列推荐模型,将商品序列输入 GRU 编码器,取最后隐状态做 Softmax 分类

注意力权重驱动的推荐理由

推荐理由直接来源于 SASRec 最后一层自注意力矩阵,体现模型真实决策依据:

  • 提取最后一层 Self-Attention 中「最后位置」对历史各位置的注意力权重向量 (B, L),反映每个历史商品对当前推荐的贡献度
  • 找出注意力权重最高的历史商品(即模型认为最相关的历史交互)
  • 若推荐商品与该历史商品同品牌 → 说明品牌偏好被模型捕捉
  • 若推荐商品与该历史商品同品类 → 说明品类兴趣被模型捕捉
  • 展示具体注意力权重数值(如 0.38),使推荐理由可量化、可验证

冷启动优势

SASRec+MLP 的属性编码机制使得新商品(缺少行为数据)也能通过品类、品牌等结构化属性获得有意义的表征,缓解冷启动问题。纯协同过滤方法(Item-CF、GRU4Rec)对新商品完全无法推荐。