背景研究
互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,这就是所谓的信息超载(informationoverload)问题。
解决信息超载问题一个非常有潜力的办法是推荐系统 ,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。和搜索引擎相比推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。一个好的推荐系统不仅能为用户提供个性化的服务,还能和用户之间建立密切关系,让用户对推荐产生依赖。
大数据提供了一种推荐方法,大数据采集顾客的反馈意见、购买记录、社交数据等,以分析和挖掘顾客与商品之间的相关性。
推荐系统是一种信息过滤系统,用于预测用户对物品的“评分”或“偏好”。推荐系统近年来非常流行,应用于各行各业。其中最典型并具有良好的发展和应用前景的领域就是电子商务领域。同时学术界对推荐系统的研究热度一直很高,逐步形成了一门独立的学科。
推荐系统产生推荐列表的方式通常有两种:比较复杂的基于算法的推荐如:协同过滤,逻辑回归、决策树以及比较简单的基于内容推荐。协同过滤方法根据用户历史行为(例如其购买的、选择的、评价过的物品等)结合其他用户的相似决策建立模型。这种模型可用于预测用户对哪些物品可能感兴趣(或用户对物品的感兴趣程度)。基于内容推荐利用一些列有关物品的离散特征,推荐出具有类似性质的相似物品。两种方法经常互相结合。而复杂之于简单的本质区别就在于是否个性化,也就是说你推荐给不同用户的东西是否相同?是否有强调不同用户的喜好区别来做推荐。
推荐系统的核心是预测用户需求,这种“预测”往往被误认为是人工智能/机器学习的一种。大数据不是要让机器像人一样思考。相反的,它是把计算机算法应用到海量数据上来发现规律性并预测事情发生的可能性。比如协同过滤通过寻找“相似”的用户挖掘兴趣的相关性,并不包含机器学习的过程。数据分析技术对推荐系统的效果至关重要。某种意义上说,数据和如何使用数据决定了数据挖掘系统的成败。
为什么要做个性化推荐?
做了个性化推荐,就能输出用户最可能产生行为的东西,最大程度提升KPI,如点击率、安装率、付费率等,这些指标也是评价最终推荐效果的依据。
如上图所示是游戏个性化推荐和人工运营精品推荐的效果对比,可以看出自个性化推荐上线后点击率效果差别是很大的。为什么会这样呢?因为尽管是人工精选出来的高质量游戏,但是无可避免的会带有一定的主观意见,并且如果没有正好对用户的胃口,会产生行为的可能性也是很低的。现在这种个性化的需求越来越普遍,也促成了各产品各业务对个性化的强烈需求。
推荐系统的构建和实际的业务场景是强相关的,效果提升之道和推荐算法的选择也是需要不断的尝试慢慢摸索。入门的话, 可以看以下书籍:
1.Segaran T. Programming collective intelligence: building smart web 2.0 applications[M]. O’Reilly Media, 2007.寓教于乐的一本入门教材,附有可以直接动手实践的toy级别代码
2.Shapira B. Recommender systems handbook[M]. Springer, 2011. 推荐系统可做枕头,也应该放在枕边的书籍,看了半本多。如果将该书及其中的参考文献都看完并理解,那恭喜你,你已经对这个领域有深入理解了
3.Jannach D, Zanker M, Felfernig A, et al.Recommender systems: an introduction[M]. Cambridge University Press, 2010. 可以认为是2010年前推荐系统论文的综述集合
4.Celma O. Music recommendation and discovery[M]. Springer, 2010. 主要内容集中在音乐推荐,领域非常专注于音乐推荐,包括选取的特征,评测时如何考虑音乐因素
5.Word sense disambiguation: Algorithms and applications[M]. Springer Science+ Business Media, 2006. 如果涉及到关键词推荐,或是文本推荐, 则可以查阅该书
想了解推荐系统的小伙伴可以私信我,后面再给大家推送相关内容,你的收藏和转发是我持续更文的动力。
本文暂时没有评论,来添加一个吧(●'◡'●)