刷微博发现#31省结婚离婚大数据#上了热搜,一时讨论热火朝天。
民政部门公布的数据显示,2020年我国结婚登记数据为813.1万对。我国的结婚率不断下降,而离婚率却持续上升,这一趋势引发了媒体和普罗大众的广泛讨论。一时之间,我国的婚姻制度显得岌岌可危,不婚主义似乎已经成为年轻人中的主流。
在诸多令人震惊的讨论背后,我们发现,不少大众对数据指标的误解,将比例指标视作率指标。
比如下图盛传的天津高达76.4%并不是离婚率,而是离婚结婚比。
但是,我们的离结率真的高达76.4%了吗?中国人真的都不愿意结婚了?
(1)那在这些夺人眼球的标题和数字背后,中国真实的婚姻状况又是什么样的?
(2)结婚率、离婚率、离婚结婚比的内涵究竟是什么?这些指标又能否反映我国真实的婚姻状况?
(3)究竟应该用哪种方式、哪些指标来分析一个人口、社会的婚姻模式以及结婚、离婚和不婚水平?
这里就要提到一个经典的数据分析法:同期群分析
什么是同期群?
相同时间内具有相似或特定属性/⾏为的群体我们称之为同期群(时间+特定属性)。
什么是同期群分析?
同期群分析(Cohort Analysis)的主要目的是分析相似群体随时间的变化而变化
简单来说,就是将⽤户进⾏同期群划分后,对⽐不同同期群组⽤户的相同指标就叫同期群分析。
首先民政部每年公布的结婚率与离婚率,实际上是粗结婚率和粗离婚率,即以结(离)婚对数除以当期平均人口数,这两个指标数据计算较为简便,也能够反映出一定时期内人口结婚和离婚事件的发生频率。
但是,婚姻事件是在一定年龄范围内的人口中才会发生,粗结婚率和粗离婚率的分母(即当期平均人口数)并没有排除掉非适婚年龄的人口,因此会受到人口年龄结构的影响。
如果人口中非适婚年龄的人口比重不断增加,那么即使适婚年龄人口中的结婚水平和离婚水平没有发生变化,也会使粗结婚率和粗离婚率呈现出下降的趋势。
而离婚结婚比的分子是那些经历了一段时间婚姻生活后选择在2020年离婚的夫妻,分母则是2020年才登记结婚的夫妻,分子和分母并不存在包含的关系,而是两批基本上毫无关系的夫妻。
也就是说,离婚结婚比并不等于一个队列中的离婚率,而只是同一时期从未婚状态进入已婚状态和从已婚状态进入离婚状态的人数之比,它并不能表示已婚有配偶者中有多少对离婚了,因此也不能准确地反映一个人口真实的离婚状况。
回到做产品分析上,又如何利用同期群分析呢?
这里在提到同期群分析的同时,有必要先引入产品用户生命周期的假设:即大部分产品的用户的使用行为是随使用时间的推移呈阶段性变化的。
以微博为例:
用户刚开始使用时,对功能不熟悉,关注和粉丝都很少,能获得到的有价值内容有限,因此使用频率较低,互动(评论、点赞)和发内容的行为很少。这个阶段,暂且定义为初期使用阶段。
随着时间推移,用户逐渐建立起了自己的关系网络,并且关注了很多感兴趣的博主,这时用户使用的频率非常高,每天花大量的时间在阅读、评论、回复、发内容上。这个阶段,姑且定义为频繁使用阶段。
时间的脚步向前不停,用户逐渐发现每天花在微博上的时间太多了,而且每天看来看去就是那些内容,逐渐产生了厌烦(兴趣丧失),恰好这时,很多其他有趣的应用如雨后春笋般展露,吸引并占用了用户的不少时间(兴趣转移),用户使用微博的时间减少了很多,而且发微博、评论也不那么及时了。这个阶段,勉强叫兴趣降低阶段吧。
再后来,用户对微博已经没有新鲜感,兴趣已基本丧失,可能隔很多天才偶尔打开一次(甚至不再打开),而且基本不再发新微博。这个阶段,跟着叫兴趣丧失阶段吧。
再再后来,彻底不用了(甚至换新手机后都不再安装微博了)……
对于微博来说,用户从初期使用、频繁使用,到兴趣降低、兴趣丧失,到完全不用,就是用户的生命周期。
而对产品的用户行为进行同期群分析,是管理和改变用户生命周期的基础。
比如针对首次启动APP的用户进行同期群分析,并观察他们接下来4周的留存情况。
横向对比:横轴是周期,以一周为一个周期,分析从一个周期到4个周期的用户留存率;从横向看,是一个群组的前后对比,比较在不同周期内的用户留存率,量化用户留存率的变化趋势
纵向对比:纵轴是同期群,以一周来划分不同的分组,每一个分组都确定一个同期群。从纵向看,是多个不同群组的对比,比较多个群组在相同周期内的用户留存率。
当对产品进行迭代更新时,通过比较不同的同期群,可以从总体上看到,产品的表现是否越来越好了,从而验证产品改进是否取得了效果,量化改进的效果。
我们还可以比较不同时间段的留存:
比如通过比较拉新后不同的同期群,我们可以看到4天,7天等时间段后再次回来的用户。
再比如通过观察每个同期群用户再次回来使用APP的天数,我们可以看到每个同期群长期的留存,而不是拉新后几天的留存。
我们可以知道用户是在哪里退出的,并且可以知道活跃用户群有什么特征,他们在做什么,这样一方面有助于我们在拉新时快速找到目标用户,另一方面我们还可以影响新用户,让他们遵循同样的路线,最终成为忠诚用户的模样。
用户行为的生命周期可以通过同期群分析来取得,并可以通过对产品的改进来影响用户的生命周期,这应该就是同期群分析的魅力所在。
如何实施?
做同期群分析,最常用的工具是用户留存表,也就是前面例子中的表格。
用户留存分析,是将用户的行为分为:
1、初始行为:如“首次打开应用”、“成功注册”或“第一次购买”;
2、留存行为:可以是用户的任意一种行为,或某个特定的行为(如“购买”,或“分享到社交网络”);
通过将用户按初始行为的发生时间分组(得到同期群),然后再统计初始行为时间后不同时段内留存行为的发生频次(或时长,或其他有意义的计量,比如消费金额),制成表格就得到了用户留存表。
不过,在进行用户留存分析时,有个非常重要的问题要注意,即:
不是用户的所有使用行为都对产品有价值。
分析用户留存,一定要找到价值行为,分析用户的价值留存,才会对产品改进产生更大的帮助。
具体来说,就是如何定义留存行为。如果只是简单的将留存行为等同于任意行为,这样得到的分析结果,不能真实的反映出用户的使用与产品的实际经营状况之间的关系,反而可能会给产品人造成一片繁荣的假象,导致产品改进走向“叫好不叫座”的误区。
最后:
同期群分析的目的在于透过现象找到结果,是一种重要的数据分析方法,更重要的是其背后的思考方式,一旦熟练掌握了它,在许多场景下都能加以运用并创造价值。
那再看回这个热搜,无论是粗结婚率、粗离婚率还是离婚结婚比,都只是时期指标,只能一定程度上反映出我国的婚姻状况,既不能反映婚姻状态的动态变化过程,更不能反映终身婚姻水平。
-END-