热搜:
编辑导语:用户画像最初是在电商领域得到应用的,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务;本文作者分享了关于用户画像的相关分析,我们一起来了解一下。

用户画像能不能提升付费率?肯定能,问题是:怎么干?

前几天就有同学A,在面试的时候遇到这个问题。同学A举手:这题我会!构建RFM模型,把用户分成27类,然后重要价值客户(111)给予VIP资格,重要保持客户(011)要主动保持联系……熟练地背诵出27类的做法。

结果,被面试官直接挂掉!

01谈用户标签,先谈场景

首先,每种分析方法,是有特定业务场景限制的。从本质上看,网上盛传的RFM做法,只适合高频互动的零售电商业务的场景,比如耐用品、母婴、医疗、保健、游戏、影视娱乐等,都不适合RFM。而这位同学正撞枪口上了:他面的是小说阅读APP。

小说业务,其付费的动力是高度内容驱动的。想让用户掏钱,至少得有内容让用户看得爽。想让用户看得爽,得知道用户喜欢什么样的内容题材。这是用户画像要解决的一个问题。

同样是内容,小说又不同于短视频或者直播。用户的爽快感,不是直接被屏幕上扭来扭去的小姐姐或者喋声喋气的“乌鸡哥”激发的,而是在持续阅读过程中,在沉浸式的体验中获得的。

这样就形成了一个逐步沉浸的转化过程:寻找内容→点击阅读→持续阅读→付费页面→付费→持续付费;因此,定位用户当前所处的阶段,引导用户向下一阶段发展,是用户画像要解决的第二问题。

此时,可以进一步去想:从小说阅读APP里,能获取何种用户标签,构建用户画像了。

02基础属性标签

一提到用户画像,很多同学又会说贯口一样说出:性别、年龄、职业、收入、爱好……只要做一个信息收集表,就能搞掂啦!

实际上确实有场景可以用表单收集。比如:

  • 母婴产品:BB出生月份数、BB健康情况;
  • 少儿教育:年龄、年级、科目(英语/语文/奥数)、目的;
  • 物流货运:货物类型、货物重量、出发地、达到地、时间要求;
  • 家政服务:家庭位置,服务内容(保姆/清洁/护理),上门时间;
  • 医疗保健:年龄、性别、身体状况、病史。

但是,这些表单是建立在业务本身的刚需之上。没有这些信息,服务根本开展不了。所以这种表单信息能受到用户的理解和配合,采集难度也相对较低,复核起来也容易。

在小说这个场景里,就不适合用表单收集。

因为对小说的“爱好”根本没啥刚需可言:

  • 爱好是多个因素综合组成,不能直接用一两个问题问清楚;
  • 爱好不是简单1+1=2,喜欢穿越,喜欢三国,不代表喜欢“穿越去三国”;
  • 爱好并不是完全固定的,有可能被新题材、热门榜单、朋友推荐等引导。

更不要提其他涉及个人隐私信息,难道看小说还需要被查户口?不受用户理解,即使强行采集,数据也是假的。

因此设计表单的时候,要保持克制,尽量找关键字段。对阅读而言,男女差异很大,且容易受到用户理解,因此可以在表单采集。并且男女,是个符合MECE的简单选项,不容易引起歧义。

换个角度,如果收集的是:阅读兴趣。

选项是:玄幻、历史、穿越、言情、霸道总裁、其他

用户很容易引起歧义,比如玄幻+穿越的,算哪类?比如大女主算哪类?用户在有歧义的时候,就会乱填一通,收集回来的数据就有问题;这些细节看似琐碎,实则决定了基础属性标签的准确度。

03关键行为标签

要定位用户当前所处的阶段,需要找能区分用户类型的最关键标签。

既然目标是提升付费率,因此付费相关标签,就是第一重要的;根据用户付费记录,可以区分三个状态:从未付费/付费一本小说/付费2本及以上。

引导方向也很清晰(如下图):

注意,上边分类里,有一个策略是导向:保持本篇续订。这就意味着,需要观察用户在阅读小说时候的进度。

如果付费的小说已经完结了/断更了,就得即使推荐新内容;如果用户根本连看都看不下去,或者已经愤然弃坑,那也得另寻好内容推荐,因此得再考虑用户阅读行为标签。

04分层行为标签

用户阅读行为对付费意义很重大。理论上,只有入坑的用户才会付费,还很有可能对更多其他感兴趣内容付费。对还没入坑的要尽快拖进坑里,已经脱坑的要防止流失;因此,区分出未入坑、入坑、脱坑状态,很重要。

“入坑”是对读者沉迷在某本小说情节的俗称。做标签定义可不能这么随便,要有具体的指标+计算公式+业务含义,才能算一个标签。

用户如果入坑了,最起码的要求是在小说APP的登录时长、登录频次有一定保证,因此可以现用比如最近一周内登录次数/登录总时长,来区分用户平台活跃的轻、中、重(如下图):

再次,如果用户入坑了一个内容,那么他肯定不会东瞄西逛,而会聚焦在一个内容里。那么这个内容占他在平台活跃时间的比例,一定相当长。

这样可以将用户是否聚焦一个内容的标签区分出来:

  • 无感:没有一个长时间活跃的内容
  • 专一:有一个长时间活跃内容
  • 博爱:有多个长时间活跃内容

具体多长算长,也得用分层分析法哦

第三,入坑、脱坑是一个动态过程。之前没有聚焦内容,之后有了,叫入坑;之前有聚焦的,之后没有,叫脱坑;因此构造标签的时候,不能只考虑当前状态,而是得关联上一个周期的状态,比如关联上一个周期,发现用户聚焦下降了,那么可以归纳为入坑。

如果聚焦上升,可以归纳为脱坑(如下图):

有了行为标签,再结合付费,就更能精准区分问题了。当然,在制定策略的时候,也要考虑用户规模,优先满足大群体的需求(如下图)。

当然,实际工作中,数据情况可能没有这么复杂。

  • 很有可能,付费/不付费用户泾渭分明,付费的看完几页就付,不付的打死都不付。
  • 很有可能,状态转化是一次性完成的,入不入坑,试读头几页立马见分晓。
  • 很有可能,用户都是专一且聚焦的,就是追一个更,追无可追才找其他的。

这些都有可能发生,而且会让数据分析变简单。但是在构造标签逻辑的时候,也要符合MECE方法,才能避免意外发生;这是专业数据分析人员与业务人员思考问题的本质区别——业务人员能直接抓最显眼的,数据则关注情况全面性与严谨性。

05兴趣偏好标签

上文有提到,直接收集兴趣会有各种问题。那还能怎么办呢?当然可以从用户行为中提炼兴趣。如果一个用户入坑了某个内容,那他肯定是对这个内容感兴趣的。

这里的难点,在于区分:他到底对哪个点感兴趣。因为一个内容相关的静态标签太多了:作者、主题、风格、评论、是否热门、写法……还有很多无法标准化的部分。

因此从一开始,就不能太指望兴趣标签做得特别精准,而是要结合小说的品类特点,把同款、交叉款单品选出来,找到贴近的单品即可。毕竟小说不是短视频,不需要15秒一切换。

当兴趣偏好与付费行为交叉,还会产生一种可能:有一类用户就是坚持白嫖,有很多关联阅读行为,但是就是不付钱;此时可用优惠券测试,把其中价格敏感型与真正白嫖到底的区分开,从而形成价格偏好标签。

06兴趣偏好标签

有了以上基础的标签准备,最终输出策略时就可以像搭积木一般,针对用户需求,组合出各种策略,只要基础打得牢,出结果是手到擒来的事(如下图)。

07小结

很多同学习惯了做网上的现成数据集。所谓的用户画像,大部分是现成的字段,尤其以直接收集的表单字段居多。

这种现成的数据集练手很爽,可与实际情况差距非常大;实际工作中,即使能用表单采集,也得考虑采集过程中错误、造假、复核问题。

更不用说,相当多数据标签需要通过分析计算+测试获得,需要一层层的构造,由简单到复杂;这些处理过程中技巧与手段,才是真正值钱的技能与能力,与大家共勉。