热搜:
编辑导语:推荐算法基于用户喜好,为用户推送其可能感兴趣的事物。这一模式有利有弊,一方面,推荐算法的存在可以帮助用户在海量信息中进行筛选,但另一方面,个性化推荐让用户喜好无所遁形。本篇文章里,作者从短视频让人上瘾这一现象入手,对推荐算法进行了拆解,一起来看一下。

“这篇文章主要是想通过短视频产品,和大家探讨一个对于数据分析师相对比较陌生的领域:推荐算法。”

一、比你自己更懂你

不知小伙伴们是否和我一样,每天都会面对一个来自灵魂深处的拷问:今天吃什么?

于是,当我打开美团外卖、饿了么外卖,首页一大波我爱吃的推荐好菜便扑面而来,妈妈再也不用担心我今天吃什么啦!当我们在淘宝、京东等购物网站完成一次购物之后,平台马上就会为我们推荐另外一些相似的商品,一不留神又开启了买买买的模式。

当我们在闲暇打开抖音摸鱼的时候,为什么会源源不断刷出自己感兴趣的视频,不知不觉大半天已经过去了,让人不得不感叹:这推荐,根本停不下来啊!

短视频是如何让你上瘾的

从衣食住行到文教娱乐,这些渗透到我们日常生活方方面面的一个个互联网产品,不断让我们惊呼:哇哦,amazing,它们简直比我自己还要了解我!小朋友,此时你脑海里是否有很多问号,它们到底是怎么做到的呢?

其实,在它们的背后都有一个强大的大脑——推荐系统。接下来我们就一起走进推荐系统的奇妙世界!

二、打开推荐系统的“黑匣子”

1. 推荐系统的目的

随着互联网信息技术的发展,我们已经身处在大数据的时代。

在浩如烟海的信息中,如何找到自己感兴趣的内容,或者说信息生产者如何让自己所要传达的信息被人们所看到,都会是一个非常困难的过程。推荐系统就像一个漏斗一样,通过对信息进行融合、摘要和筛选,最终呈现给用户自己认为或者商家觉得“有用的信息”。

短视频是如何让你上瘾的

2. 推荐系统分类

3. 推荐系统核心流程

短视频是如何让你上瘾的

推荐系统本质是一个信息过滤系统,它基于用户数据、用户行为数据和商品内容信息并通过一定的算法来预测用户的偏好,根据用户的偏好特点过滤掉用户不感兴趣的商品或者内容,从而通过“千人千面”的手段不断的吸引用户留在产品上。

按照流程通常分为:召回、排序、重排序这3个核心环节,每个环节逐层过滤,最终从海量的物料库中筛选出几十个用户可能感兴趣的内容或商品推荐给用户。

三、短视频个性化推荐大揭秘

1. 基于用户的协同过滤

核心思想:A和C两个用户相似,给A推荐C喜欢且A没有看过的东西。

短视频是如何让你上瘾的

2. 基于物品的协同过滤

核心思想:两个视频1和3相似,给C推荐与视频1(A和C都喜欢)相似的内容。接下来,我们以基于用户的协同过滤为例,通过短视频推荐的案例给大家进行略作详细讲解。

假设在某短视频平台有ID为DY001至DY006的六位用户,他们可能对不同短视频进行浏览、收藏、点赞、评论、分享等行为操作。为了衡量不同用户对不同短视频的兴趣度,我们可以设计一个简单的模型,对不同行为赋予相应的分值,如下表:

短视频是如何让你上瘾的

根据用户的行为计算视频得分,满分10分,加到10后则不再累加。比如某一用户对搞笑类视频打分是8分(可能是浏览1分,点赞3分,分享4分),然后,我们就能得到DY0001至DY0006这六位用户对各种类型短视频的偏好程度得分表(0为完全没兴趣,10为非常有兴趣,空白为暂缺):

短视频是如何让你上瘾的

很显然,通过根据用户在不同视频上的得分情况,可以得到用户对不同视频的喜爱情况,在此基础上构建出用户特征向量,然后根据余弦相似度可以判断用户之间的相似性。

短视频是如何让你上瘾的

根据相似性可以建立用户相似矩阵(得分越接近1代表两个用户越相似),可以一定程度上判断两个用户在视频偏好上的相似程度。

短视频是如何让你上瘾的

进而我们可以认为,如果用户A和用户B比较相似,可以认为A喜欢的书B应该也喜欢。因此我们在给用户A进行视频推荐时,找到与其相似度较高的其他用户,然后过滤掉用户A已看过的视频,结合相似用户对某个视频的喜爱程度以及该用户与A用户的相似度进行加权,得到的推荐指数越高的视频越优先进行推荐。

当然,对于不同的短视频平台,其对用户的不同行为所赋予的权重是不一样的,以下是抖音和快手的部分策略对比,仅供参考:

短视频是如何让你上瘾的

四、结束语

本篇文章,我们从生活中的“个性化推荐”现象入手,一起探讨了系统过滤推荐算法的原理以及简单的应用。

当然,协同过滤推荐算法并不是万能的,它过度依赖用户的历史数据,面对新的用户或者新的物品,在开始的时候没有数据或数据较少时,协同过滤算法无法做出较为准确的推荐。需要等数据积累,或者其他方案进行弥补缺陷,也就是常说的冷启动的问题。