01 写在前面
用户画像,大数据时代老生常谈且又长久不衰的话题,公司都在搞,文章满天飞,在这个人人都喊“数据驱动业务”的时代,你不懂用户画像,不搞用户画像,你都不好意思跟别人聊(chui)业(niu)务(pi)。
但是,用户画像是不是一定要搞?为什么要搞?不搞可不可以?如果一定要搞,用户画像耗时耗力,怎么才能把它真正落地到业务?而不是开发了N多的标签,放在数仓里吃灰?搞之前多问几个为什么,你会发现落地的可能性就大了很多。
在写这篇文章之前,我也拜读了不少用户画像相关的文章,但是很可惜,很多文章可能搞错了一点,那就是用户画像是业务,不是技术!用户画像一定是来源于业务,并且最终落地到业务上去的。那些不管业务需求、标签体系,上来就是用户画像怎么实现的,这无异于吃饭点了一盘土豆丝,大厨埋头给你搞了一道佛跳墙,然后跟你巴拉巴拉扯做佛跳墙牛叉的108步骤,呵呵,只能说,技术自嗨,最为致命,一切不以需求为出发点的应用,都是在耍流氓。
这也是写这篇文章的初衷,用户画像是什么?一般在什么场景下会用?我们的业务场景是不是真的需要这个费时费力的大家伙?如果真的需要,业务需求是什么样的?标签体系如何搭建和开发?开发后如何使用和进一步迭代优化?只有把这一步步想清楚做仔细,才能最终落地到实际的业务中,发挥用户画像真正的价值。
02 什么是用户画像?
用户画像是指根据用户的基本属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。每一个标签及标签权重是表征用户偏好的一个向量,一个用户可以理解为多个偏好向量(标签)的和。--来自某度的看不懂的解释
说人话!!!用户画像是基于你在互联网上留下的种种数据,将这些数据在你知情或者不知情的时候,通过数据加工,产生的一个个刻画你兴趣偏好的标签组,这就是用户画像。
那么接下来的问题就是:用户画像的使用场景有哪些?
1、用户分群运营
分群运营是用户画像最常用的场景,通过用户画像的标签筛选,筛选出不同的用户群,通过push或弹窗配置平台,对不同的用户群实现精细化运营。
比如我们可以把过去30天购买金额大于500、活跃天数大于10天、最近一次活跃间隔在5天以内的用户定义为高付费潜力用户群,进而对这部分高潜用户进行精细化运营。
2、自动化触达
分层越来越精细,用户群的粒度会越来越小,最后会小到一个个体。我们针对每个个体去做push或者弹屏,运营效率还是太低了。基于用户画像的自动化触达就发挥了作用。比如针对上一步我们创建的高付费潜力用户群,我们通过App Push的方式发送一张满200减40的优惠券。
3、个性化推荐
以用户画像为基础构建推荐系统、搜索引擎、广告投放系统,可以有效提升转化率。我们先看一下用户画像的用户偏好表存储表(用户画像有很多这种标签,下面我们会详细展开具体讲解):
当我们购买完成一个带有标签1,标签2,标签3的商品后,一般在购买完成页会有交叉销售场景,我们通过用户偏好表的标签及权重,基于用户相似或商品相似的协同过滤算法,推荐用户可能喜欢的其他商品。
4、用户统计&行业研究
根据用户的属性、行为特征对用户进行分类后,统计不同特征下的用量、分布,分析不同用户画像群体的分布特征和走势等。
另外,还可以通过用户画像分析可以了解行业动态,比如人群消费习惯、消费偏好分析、不同地域品类消费差异分析。比如我们经常听到马爸爸拿一些标签,说这个地方人喜欢买什么?为什么喜欢买?那个地方人都是买什么型号?
03 到底需不需要用户画像?
大学刚毕业时,初到一家互联网公司做数据运营,某天领导突然给我一个任务:做一个APP用户画像报告。当时我有点懵,一是我以前确实没接触过用户画像,概念不太清楚;二是接到领导的任务后我只知道要做一个用户画像,至于这个用户画像到底用来做什么我并不清楚。
在这个情况下,我查阅各种资料,问同学、问朋友,还找了一些高大上作图工具,最后总算是完成了任务,得到了公司认可。但用户画像到底给公司带来了什么价值,给运营决策起到了什么作用并不清楚,这其实就是典型的随大流,为了做而做。
这种面子工程非常常见,大家可以看看自己公司的情况对号入座,因为大家都在谈论用户画像,于是很多领导也开始要求做用户画像,别人有我们不能没有,但用户画像到底为了解决什么问题并不清楚,自然而然就没有落地的可能性,更不可能产生价值。
所以为了解决这个问题,在最开始的时候就要想清楚,我们是否真的需要用户画像?只要想清楚一下三个问题,就可以得到答案。
1、我们业务中是否有能用到用户画像的场景?比如用户分层、智能触达和个性化推荐。
2、如果有使用场景,是否一定要通过用户画像实现?用户画像本身是一个非常浩大的工程,十分耗时耗力,我们有没有其他替代的方案?
3、如果必须要搞,那我们给用户打了标签进行分层后,我们有没有对应的产品服务或运营方案?分层后没有对应的action,用户画像还是难以落地闭环。
以上问题如果没有想清楚,就盲目搞用户画像,结果很可能就是弄出来的用户画像远离业务,没有实用价值、无干货,被业务部门讥讽为“大而无用”的鸡肋产品。
所以,在规划用户画像平台时,一定要有目的性和场景感,不能只做表面文章,而不重视实际应用价值。
这里需要强调的一点是:不是因为我有了用户画像,才能驱动和提高业务。而是为了驱动和提高业务,才需要去建立用户画像。这是很容易犯的因果倒置的错误!
以上问题没有想清楚,千万不要动手开发,如果以上的问题想清楚后,还是要搞,那我们就要认真筹划,用户画像怎么做才有价值。
04 用户画像怎么才能落地?
已经确定要搞用户画像,接下来就要思考:怎么搞才能业务落地?怎么搞才能产生价值?
刚开始做用户画像的时候,业务部门摇头晃脑的说:“我们要基于用户画像,详细深入的了解用户,比如用户性别,年龄,地域,喜好,消费习惯,……这样我们就能精细化决策了”。然后数据部门夯吃夯吃搞了几个月,打了30000个用户标签,还得意洋洋的跟领导汇报:“我们的用户画像大数据建设取得长足进步”。
然后项目第一期汇报会上,数据部门得意洋洋的讲到:
我们的用户男女比例6:4华南地区占比30%
华东25%购买A产品占比50%
巴拉巴拉巴拉......
业务部门一个白眼抛过来,
我早知道了!我们的用户都是这样的呀!
然后呢?
你做这有啥用?......
当然还有更惨的,
就是你贴个“忠诚用户”的标签,业务方说:哦,既然那么忠诚,就不做啥动作了。结果丫下个月不消费也不登录了!
你贴了“A产品爱用者”的标签,业务方推了A产品,丫没有买!
业务方怒气冲冲找来算账:“这用户画像一点都不精准嘛!”
于是,项目彻底凉凉。问题到底出在哪里呢?你丫的根本没有了解业务的需求啊,业务方想吃个简单的酸辣土豆丝,你吭哧吭哧跟业务方扯佛跳的108道工艺,或者虽然你了解了业务方的需求,但是这个标签你打的不准啊,我要的是酸辣土豆丝,不是青椒土豆丝......
所以要想用户画像能落地,以下几个步骤尤为关键。
1、明确业务需求
在规划用户画像时,一定要有目的性和场景感,不能只做表面文章,而不重视实际应用价值。再次强调:不是因为我有了用户画像,才能驱动和提高业务。而是业务有需求,才需要去建立用户画像!
第一步也是最为关键的一步,一定要搞清楚业务方的需求是什么?要解决的问题是什么?
举个栗子,一个内容型社区近期准备上线一个知识付费模块,通过该模式进行商业变现,想通过用户画像将精准的内容推荐给精准的人,进而促进付费变现。基于此,可以把业务目标和要解决的问题梳理如下:
2、标签选择
需要选择哪些标签?为什么要选择这些标签?其他的标签为什么不可以?选择标签有哪些误区?
我们都知道有用户基础属性的标签,也有用户的各种行为标签,我们需要在这个大的框架下不断细分完善标签体系。但是为什么要选择这些标签,比如用户的购买行为标签中,为什么选择新、老用户这个标签呢?因为我们的店铺针对未消费的新用户会有新人红包进行引导消费,所以要区分新老。对于老用户,我们为什么要选择最近一次购买时间,购买频次和交易金额作为标签呢?因为可以通过RFM对用户价值进行分层,进而进行精细化运营。
具体的标签体系搭建步骤我们会在第三部分中具体介绍,这里先不展开。
3、制定不同画像用户的运营策略
不同标签将用户划分为不同的用户群,但只有对不同的用户群制定针对性的运营策略,用户画像才能落地有价值。
举个栗子,在RFM模型中,有的同学不清楚用户交易金额M如何确定阈值,进而划分为高和低呢?是消费1000元算高还是10000元算高,有些同学因为这个纠结不已,为什么不反过来想呢?阈值设为1000或者2000我对应策略是什么?如果没有对应的策略,我划分了高低有何用处呢?这个时候不妨问问产品和运营的同学,你会发现运营上为了促进价格敏感的低客单价用户有满1000减200的满减活动,对于购买能力较强的金主爸爸,有满2000送独家定制的钻石会员卡,可以享受超级VIP待遇,以终为始,这个时候用户画像是不是更容易落地了?
05 用户画像的构建步骤
已经明确了业务需求以及不同画像用户的对应策略,下面就可以开始用户画像
的构建了,主要分为标签体系搭建和标签权重计算,简单来说,就是用哪些标标签表征用户,用户在各个标签上的偏好程度如何。
1、标签体系构建
理解用户画像,最直接的方式便是将画像信息标签化。信息标签化是用户画像系统用信息化手段刻画用户全貌的手段,也是用户画像系统中最核心的环节之一。我们通过构建丰富的标签,获取相关的标签数据,才能够刻画和洞察用户的兴趣和偏好。
1)标签体系的构建方法
构建标签体系的主要有两种方法:
方法一:结构体系化构建(常用)。通过划分标签类别和维度,从刻画用户的完整维度出发构建维度体系。这样的划分方式结构清晰、逻辑性强,能够比较全面的梳理出所有的信息维度,但受限于实际数据,落地较困难。
方法二:场景效果化构建。结合人群定向的实际需求,通过用户在不同行业领域或平台上的行为记录,对用户的心理需求和倾向性进行描述。这种方式目的性强,人群定向也较为精准,容易跟实际应用场景接轨,落地到具体的业务目标,跟实际数据结合较好,但标签会跟随消费趋势、娱乐热点等的变化波动。
2)标签维度的设计思路
标签维度设计上不仅需要清晰直观,还需要考虑多个场景化使用需求,同时兼顾多种产品运营需求及商业化投放需求。
标签设计上需要在了解业务方规划前提下,对标签的使用上有前瞻性的设计。
画像数据的来源一般有:用户调研、用户行为数据获取、客户端/服务端数据内容上报、第三方数据平台、基础数据及爬取第三方数据等。
ps:此处需要特别关注以下两个方面:
标签粒度:粒度过粗不利于运营使用推广,很容易脱离业务本身,对行为数据进行过度提炼造成信息丢失;而粒度过细则会导致标签覆盖率过低、耦合运营业务推广。
标签数据:标签数据的获取直接关系到实际使用价值,需要在可获取的数据范围内进行,扩宽数据源难度较大,通常需要优先进行数据可行性的统计。
3)标签体系的基础框架
不同业务的画像标签体系并不相同,需要我们针对性的提炼出来。有一种比较简易的方式是:我们可以先找出一些通用类画像标签,然后再根据实际场景和需求补充业务类画像标签。这样得到的标签体系会相对比较完整,也能够随业务变动及时调整优化。
通用类画像标签体系(参考):
业务类画像标签体系(以某电商公司为例,参考):
按照以上的框架将用户画像信息标签化,能更好的根据实际需求去获取相关的用户画像数据。但是,需要注意的,产品用户画像的分析并不是要用到所有的标签数据,并且越是完整的标签体系,落地是越是困难。而且,更大的难度在于如何精准描述用户特征。因为只有用户特征描述越精准,我们得到的用户画像才会越清晰,在实际应用过程中的帮助越大。所以如何精确计算出用户的标签的权重就成为重中之重。
2、标签权重计算
用户在不同标签上的偏好是通过权重来反映的,权重越高,说明用户在该标签上的偏好越强,反之亦然。而且,这个权重会随着时间变化而变化,标签权重的计算主要通过TF-IDF算法。
1)TF-IDF算法思想
用户标签权重,是由该标签对用户本身的重要性(TF-IDF权重)与该标签在业务上对用户的重要性(业务权重)两者共同决定的,
即:用户标签权重 = 业务权重* TF-IDF权重。
TF-IDF权重是通过TF-IDF计算得到的,业务权重是通过用户对标签的行为来决定的,
即:业务权重=行为类型权重 * 行为次数 * 时间衰减
2)简单理解
就是用户对一个标签的重要程度,会用不同行为来表达,不同的行为有不同的难度,比如:对于电商用户的行为难度来说,支付>收藏加购>分享>浏览>点击。不同行为就会有不同的权重,行为越难代表越喜欢,权重越高,同理行为次数越多也代表越喜欢。
标签对这个用户来说越稀有代表越喜欢,喜欢程度会随着时间的增加而逐渐降低,通过这个公式计算标签权重。
3)行为类型权重
用户浏览、点击、搜索、收藏、分享、下单、购买等不同行为对用户而且有不同重要性,一般根据业务经验或者使用层次分析法定义一个基本行为权重。
4)行为次数
这里的行为次数表示每一种行为的次数。
5)时间衰减
时间衰减是指用户的行为会随着时间的流逝,用户偏好会不断减弱。在建立与时间衰减相关的函数时,我们可套用牛顿冷却定律数学模型。
牛顿冷却定律:较热物体的温度F(t)是随着时间t的增长而呈现指数型衰减,其温度衰减公式为:
F(t)=T*exp(-α*t)。T:初始温度
α:衰减常数即冷却系数,是自己定义的数值,一般通过回归可计算得出
t:时间间隔
冷却系数如何计算呢?
冷却系数是自己定义的数值,一般通过回归可计算得出。例如:初始偏好设置为1,1天后的偏好为0.85,即 0.85=1*exp(-α*1),求得α=0.16,这个就是标签的冷却系数。
在这里我们用Python语言来模拟一下这个冷却曲线:
import numpy as npimport matplotlib.pyplot as plt
import math
t = np.arange(0,100)
plt.plot(t,1*np.ma.exp(-0.16*t))
plt.title('偏好度冷却趋势')
plt.ylabel('偏好度')
plt.xlabel('时间(天)')
plt.show()
6)举个栗子
用户“小美”,对于标签“口红”的权重计算:假设我们之前定义冷却系数α=0.16,基于业务经验或通过层次分析法假设行为类型权重:点击(0.1)、浏览(0.2)、分享(0.5)、收藏加购(0.6)、支付(0.9)。
小美的每日行为表:
2021-05-01:
2021-05-02:
2021-05-03:
用户“小美”对标签“口红”每天的权重:
2021-05-01:2*0.1+2*0.2+3*0.6+1*0.5+1*0.9=3.8
2021-05-02:3.8 *exp(-α*1)+1*0.1+1*0.2+2*0.6+1*0.5+0=5.06
2021-05-03:5.067718*exp(-α*1)= 4.32
这样算下来是不是就很清晰了。
06 用户画像效果评估&迭代
在初步形成了用户画像后,并不能直接交给运营、业务人员直接使用,还需要评估用户画像的准确性,以及交付使用后不断迭代用户画像,以获得更加精准的用户画像。
评估方式主要分为3种:逻辑验证、A/B test、用户回访。
逻辑验证:也叫做交叉验证,在完整的用户画像标签体系中,一些标签往往会存在一些相关性;比如用户的累计在线时长越长,订单量通常会越高;比如购买3C产品的用户群中,男性用户数通常大于女性用户数;另外,如果公司购买了第三方机构的数据,也可用于交叉验证。
A/B test:也叫做灰度测试,以上述的忠诚度为例,保证对照组、实验组的流量相同;对实验组的用户,进行提升忠诚度的运营策略(促销活动、积分奖励等);如果实验组的用户,忠诚度相比对照组用户,有一定提升,则可以认为用户画像比较精确。
用户回访:最朴实的评估方法,比如用户画像系统,定义了10万用户为低忠诚度用户;此时从中随机抽取1000人,交给客服,进行回访。根据回访结果,判断用户画像结果是否准确;甚至可以对回访结果进行文本挖掘,形成词云,查看消极词的占比。
07 总结
本文很长,所以最后还是要做个总结,区别于其他文章单纯阐述如何构建用户画像,这篇文章系统而全面的分析了用户画像是什么?是否一定要搞?怎么搞?层层递进地说明了:什么是用户画像?→ 什么场景会用到用户画像?→ 我们是不是真的需要用户画像?→ 用户画像怎么搞才能落地?→ 能落地的用户画像的构建步骤 → 用户画像的效果评估&迭代。
希望我们在做用户画像的时候都能多问几个为什么?知道为什么要做远比知道怎么做更重要,只有这样,才能做出落地且有价值的用户画像。
以上就是数据分析思维—用户画像部分的内容,更多数据分析思维的文章持续更新中,敬请期待,如果觉得不错,也欢迎分享~
-END-