什么是推荐系统的用户画像
用户画像又叫做User Profile,主要用于营销领域,营销人员需要对营销的客户有更精确的认识,从而能够更有针对地对客户和市场制定营销方案。当传统的营销领域,是以销售人员为第一人称视角去看待客户的,也就是用户画像是为销售人员服务的。这种用户画像一般会出现在高大上的 PPT 中:用标签云的方式绘制一个人的形状,或者使用人口统计学属性来表达一个人物形象,以此来表达“用户画像”这个概念。
而推荐系统的用户画像应该给机器看,而不是给人看的。推荐系统一般是通过对用户和物品之间的匹配评分,也就是预测用户评分或者偏好,从而建立起用户(User)和物品(item)的连接的。所以推荐系统在对匹配评分前,则首先需要对用户和物品向量化,这样才能进行计算。用户向量化的结果就是User Profile,所以用户画像不是推荐系统的目的,而是在构建推荐系统的过程中产生的一个关键环节的副产品。
用户画像的关键因素
- 维度:每个维度的名称都是可理解的
- 量化:这里的量化应该是客观的,也就是说在实际生产环境中,用户画像每个维度的量化,应该交给机器,而且以目标为导向,以推荐效果好坏来反向优化出用户画像才有意义。
- 效果:用户画像只是推荐系统的副产品,所以要根据推荐效果(排序好坏、召回覆盖等指标)来指导用户画像的量化。
用户画像构建的方法
- 查户口:直接使用用户的原始数据作为用户画像的内容,如用户的基本信息、购买历史,除了清洗数据之外,数据本身并没有做任何抽象和归纳。
- 推数据:对用户的历史数据进行描述统计分析,使用统计数据作为用户画像的内容,如用户最近一周消费金额等。
- 黑盒子:使用机器学习方法,通过对用户的原始数据进行学习,得到人类无法直观理解的稠密向量,但实际上这种方法在推荐系统的作用最大。如使用潜语义模型构建用户阅读兴趣、使用矩阵分解得到用户和物品的隐语义因子等,这一类用户画像数据通常是不可解释,不能直接被人看懂。