SASRec + MLP 核心模型
融合用户行为序列建模与商品多源属性编码的推荐模型:
- SASRec 序列编码器:使用多层自注意力机制(Transformer Decoder)捕捉用户兴趣的时序演化,输出用户表征向量
- 商品 ID Embedding:与 SASRec 共享的 Embedding 层,编码协同过滤信号
- 属性 MLP:将品类、品牌、a1-a3 等离散属性通过独立 Embedding 编码,连同评论数等连续特征投影到统一空间
- 融合方式:商品表征 = ID Embedding + 属性投影,兼顾行为信号与内容语义
- 训练策略:Sampled Softmax,梯度同时流过用户侧和商品侧
对比基线
- Item-CF:基于物品共现的协同过滤,统计商品在用户序列中的共现频率,用余弦相似度推荐相似商品
- GRU4Rec:基于 GRU 的序列推荐模型,将商品序列输入 GRU 编码器,取最后隐状态做 Softmax 分类
注意力权重驱动的推荐理由
推荐理由直接来源于 SASRec 最后一层自注意力矩阵,体现模型真实决策依据:
- 提取最后一层 Self-Attention 中「最后位置」对历史各位置的注意力权重向量 (B, L),反映每个历史商品对当前推荐的贡献度
- 找出注意力权重最高的历史商品(即模型认为最相关的历史交互)
- 若推荐商品与该历史商品同品牌 → 说明品牌偏好被模型捕捉
- 若推荐商品与该历史商品同品类 → 说明品类兴趣被模型捕捉
- 展示具体注意力权重数值(如 0.38),使推荐理由可量化、可验证
冷启动优势
SASRec+MLP 的属性编码机制使得新商品(缺少行为数据)也能通过品类、品牌等结构化属性获得有意义的表征,缓解冷启动问题。纯协同过滤方法(Item-CF、GRU4Rec)对新商品完全无法推荐。