题目
推荐系统的冷启动分为哪几类?请列出每类的常见解决方案。
参考答案
冷启动:无足够历史数据时难以精准推荐,分三类:
1. 用户冷启动(新用户)
- 注册信息利用:地域、年龄、性别、设备等基础属性做人群包推荐。
- 引导选择:首次进入让用户选兴趣标签(如 TikTok 注册后选话题)。
- 热门/优质内容兜底:新用户先推全站热门,保证基线体验。
- 跨域迁移:若用户在其他产品有数据,迁移画像(如微信读书用微信关系链)。
- 快速学习:用户少量行为(几条点击)后立即用在线学习更新模型。
2. 物品冷启动(新物品)
- 基于内容:用物品自身特征(标题、图、类目)找相似已存在物品,借它们的流量启动。
- 流量扶持:给新物品曝光配额(如小红书对新笔记流量倾斜),收集反馈。
- EE 探索:Bandit 类算法(如 LinUCB)在”利用热门”与”探索新品”间平衡。
- 双塔内容召回:物品塔用内容特征编码,新物品无需历史即可被召回。
3. 系统冷启动(新系统)
- 导入外部数据:竞品公开数据、行业通用热门榜。
- 简单规则起步:先按热度/时间推,逐步积累数据再上复杂模型。
- 迁移学习:从类似场景的预训练模型起步。
通用技术手段:
- Multi-Armed Bandit / UCB / Thompson Sampling:经典探索-利用算法。
- 强化学习:把推荐建模为 MDP,长线优化用户生命周期价值。
- 元学习:学一个”快速适应”的模型,少量样本即可个性化。
- 图神经网络:利用用户-物品二部图结构,相似用户/物品的信息可扩散到冷启动节点。
面试加分点:
- 指出冷启动的本质是信息不足,所以解法都围绕”补信息”:用内容/属性补行为缺失,用探索换数据,用跨域/图结构借他人数据。
- 强调**EE(探索与利用)**是长期价值的关键——纯利用热门会信息茧房,纯探索伤体验,需平衡。
- 业务手段(流量扶持、引导选择)往往比算法更直接有效,体现”产品-算法协同”思维。
出处:推荐系统面经、掘金《推荐系统四层架构深度拆解》。
内容来源
整理自推荐系统面经与掘金相关文章
本站内容整理自公开面经与开源仓库,仅供学习交流,严禁杜撰。