《推荐系统》基础知识

在信息系统领域里, 有两个堪称双子星的应用, 那便是搜索引擎以及推荐系统

推荐系统与搜索引擎,有许许多多技术是重合的。那么其中区别在哪里呢?

  • 搜索引擎是pull模式, 推荐系统是push模式。
  • 搜索引擎是系统掌握主动权,而推荐系统则是用户掌握主动权。
  • 搜索引擎是提供短时间的,不稳定的信息检索;而推荐系统则是提供更长时间的信息供给。

推荐系统曾经还有一个名字,叫做filtering system(过滤系统)

推荐系统实际上有两种最基本的设计思路:content-based filtering,基于内容的推荐,是对用户本身进行分析。还有另一个是collaborative-filtering,基于用户的推荐,是对同类型的用户进行分析。其实你仔细想想不管咋做这个事,也就这两种思路而已。当然了,现代用的商业推荐系统所采用的技术比这个要复杂得多。

基于内容的过滤 content-based filtering

根据用户过去的行为和喜好,通过分析项目的内容特征来为用户推荐相似的项目。

协同过滤 collaborative-filtering

通过分析用户的行为和偏好(用户画像),找到与其相似的其他用户或物品,从而推荐给用户可能感兴趣的内容。

数据挖掘与机器学习在推荐系统中的应用

理论上,数据挖掘和机器学习的所有算法都可以被加工成推荐系统所需要的算法。因为数据挖掘的两种维度:总结过去/预测未来, 而预测未来就是推挤系统的意义

推荐算法的步骤

推荐分为召回粗排精排多样性重排推广几个模块

  • 召回,将海量集合返回万千级集合,在某种意义上决定着整个推荐的天花板;
  • 粗排,本质上跟精排类似,只是特征和模型复杂度上会精简;
  • 精排,精排解决的是从万千级别集合到几十级别的问题,重中之重,在特征和模型上都会做的比较复杂;
  • 重排,重排层解决的是展示列表总体最优;

扩展阅读

深入理解推荐系统系列文章
搜索推荐系统相关技术业务落地方案及码源

此处评论已关闭