背景
01 数据的价值
从2012年大数据概念兴起至今,毫无疑问数据已逐渐成为全世界最重要的生产资料。著名咨询公司麦肯锡几年前曾对全球多家知名且快速增长的企业进行分析,发现这些公司的一个重要共同点就是数据能力很强(包括数据基建、分析能力、数据驱动理念),且能够充分发挥数据的价值,赋能企业增长。那么数据的价值究竟是什么?
首先从人与世界的关系角度,个人认为数据是客观世界的映射,是在某种方法之下对实体的数字化表达。可以帮助人类看清、探索世界,发现世界运行的规律,辅助指导人类优化世界的方向。
其次从资源角度,个人认为数据就像石油,是最基本的生产资料和基础建设必备资源,用于支撑互联网、IoT等更先进的工业模式,从而驱动人类的进化(Evolution,内卷的反义词)。
最后从商业角度,个人认为数据的价值应该体现在帮助企业提高收入、提高效率、降低成本、降低风险。
02 数据分析的价值
数据虽然价值巨大,但就像石油只有被加工利用才能体现价值一样,只有经过必要处理、分析挖掘后,才能真正体现价值。其中分析可以认为是最重要最有价值的环节之一。
由于本文不是数据分析科普文,关于定义、方法论、方法就不再一一赘述了,相信很多读者都有所了解,不了解的可以百度一下。关于数据分析的价值层级,在去年发表的数据算法赋能京东PLUS会员增长—方法论与实战一文中“数据分析”章节有详细介绍,感兴趣的读者可自行阅读参考。
03 传统数据分析范式的局限
常规的数据分析流程,主要是依靠数据分析师。
1. 通过写取数代码取到数据
2. 在Excel等轻量BI工具中透视分析
3. 数据分析报告这样的范式进行数据分析
从存在即合理角度看,这样的流程肯定有存在的意义,但个人一直觉得这种范式有些问题和局限。
1. 决策效率低:首先提数->BI工具离线分析->数据报告ppt流程不短,且每个环节所花费的人力都不小:提数一般是hive,跑数慢;BI工具如果不熟练还需要学习或熟悉,且透视表每次都可能需要重新搭建;ppt用于汇报的话要求往往不低,一般情况至少一周。整体上分析的绝对成本以及边际成本都不低,且决策会因分析过程冗长,造成滞后性。在商场如战场的时代,决策的及时性和效率对企业的重要性不言而喻。在你写ppt的时候,可能竞争对手已经完成多轮分析并开始进行新战略战术的验证了。
2. 边际成本高:其次这种分析范式的数据往往只是某个数据片段,天然无法自动长期观测,下次同样的分析思路,还需要重新来过,浪费不必要的时间人力成本。
3. 决策风险高:个人认为企业决策依赖某位,或某些数据分析师的洞察和结论,风险是非常高的。因为毕竟个人的认知都有局限性,有可能因为认知偏差或错误导致分析结论与实际情况不符,进而影响关键重要战略决策!
鉴于上述分析,笔者认为需要通过产品化的方式将数据分析的过程、结论以产品或工具形式输出,形成能力赋能更多人去使用、去决策,实现真正意义上的数据驱动与集体智慧相结合!
数据产品的价值
01 数据产品概述
数据产品的定义
像任何概念一样,随处可以搜到不同版本的定义。本人目前比较认可喜欢的版本是:“数据产品是一种降低用户使用数据的门槛,并发挥和提高数据价值的产品类型,与之对应的有用户产品和商家产品”。之所以认可是因为定义非常清晰且直击核心本质,不玄学不八股说人话,同时也与本人的理解非常一致。
笔者首次接触数据产品是几年前加入SAS(不是SaaS)公司后。数据领域的从业者应该都听说过SAS(Statistical Analysis System),这是一家专注在数据分析、数据挖掘、数据科学产品领域的开山鼻祖公司之一。尽管在互联网行业使用不多,但在金融、医药领域仍然是公认权威的数据产品,可能没有之一。从某种意义上我要感谢在SAS的这段经历,让我在很早有机会接触到数据产品。
数据产品的组成
一个完整的数据产品通常由采集清洗、计算管理、分析展示和挖掘应用四个模块组成
1. 采集清洗:采集指的是产品通过各种技术手段,将现实世界的信息线上化之后,再传输到企业的服务器和数据库中;清洗是指对采集到的信息中存在的数据缺失、冗余、错误等情况进行整理和优化,以确保输入的信息尽可能完整准确。这个步骤与常说的ETL(抽取、转化、加载)很相似,属于“脏活累活”,但对数据分析以及决策至关重要。
2. 计算管理:第一步采集清洗后的信息其实还不能体现太大的价值,因为这些信息并不能被直接用来扩大对客观世界的认知,需要根据不同业务场景和需求进行汇总计算才能成为真正有价值的数据。
3. 分析展示:此时需要通过模块化的数据分析方法、数据可视化组件对上述数据进行解析与展示,以最终实现对客观世界矛盾的描述探索、诊断归因、预报预测,并形成优化决策建议,赋能商业
4. 挖掘应用:对于需要使用到算法模型的场景(如搜索、推荐、反欺诈等),也可以将算法模型进行模块化、产品化,将算法能力赋能给非算法人员,实现算法价值的放大
02 数据产品的分类
根据产品的使用对象可以将数据产品分成两大类:商用数据产品和企业数据产品。
1、商用数据产品
这类数据产品由企业或个人开发,提供给外部企业免费或付费使用。在发达国家这方面起步较早且分类精细。国内的话因为市场成熟度相对低,且由于商业环境等问题(盗版软件),这个领域尚处于起步阶段。以下是常见8类商用数据产品全景介绍:
2、企业数据产品
这类数据产品往往有企业自建自用,主要目的是降低员工使用数据的门槛,辅助人员作出决策和提高业务效率。根据内部定位,企业数据产品可再细分为应用型和平台型。
平台型数据产品:为企业内部各种数据应用提供底层系统支持。
上述商业数据产品中不乏这类产品。以目前业内名气较大的GrowingIO相关产品为例,个人理解其本质是通过接入企业底层数据源,通过无埋点等技术实现对企业数据的全方位打通,得以进行人、货、场等多视角数据分析,赋能业务方实现类似精准营销、精细化运营场景。京东中台据我了解也有较完善的平台级数据产品,这里简要介绍本部门用的最多的一款敏捷BI产品,EasyBI(原京动力)。
在我看来这是一个类似Looker的敏捷BI产品,可以从数据源接入->数据ETL->可视化看板创建->自由探索分析->报表订阅输出 全流程完成敏捷数据分析,大幅提升了数据分析效率。该产品是本人在京东用的最多,也是认为最有价值的数据产品之一!
应用型数据产品:企业数据应用,更多是结合业务场景设计对应的共建或产品来提高效率。
场景可以是数据化运营、可以是智慧营销、可以是智能分析。笔者所在部门做的数据产品更多属于这一类,在后文会单独介绍
03 数据产品核心优势
这里敲下黑板,因为是本文的核心思想。
1. 放大分析的价值:传统数据分析范式中往往依靠一两个分析师基于某时间窗口的数据,针对某个主题进行静态分析,决策也只能基于该次分析做出。而通过数据产品,可以让所有使用者在任意时刻对任意窗口数据进行分析和决策,基于集体智慧的分布式数据驱动决策,效率和决策产出要远远大于前者!对于企业来说好处不言而喻。
2. 提高分析效率:传统分析范式不仅时间周期长,且一次分析往往只能得到非常有限的洞察和决策;数据产品范式每次分析的效率会有巨大的提升。同样交付周期内,可能会得到无数个分析洞察结论,产生多个有效决策(蝴蝶效应)
3. 沉淀分析能力:作为研发团队,能力沉淀是领导们非常重视的事情。对于什么是能力沉淀,本人最近也有一些思考,那就是将工作内容以工具、产品形式沉淀;将工作经验以文档、文章形式输出。不一定全面正确,但自认为相对清晰。那么在我看来数据产品应该是数据分析能力的最佳沉淀方式之一。
4. 降低决策风险:俗话讲:“三个臭皮匠赛过诸葛亮”。这个比喻听上去不太高大上,但背后的哲理我认为还是可以用到这里。通过群策群力、集体智慧不仅可以有效增加输入,更可以规避因个人的认知偏差或错误导致分析结论与实际情况不符,进而影响关键重要决策!
5. 降低分析成本:传统分析范式交付周期比较长,一般从数据提取->离线分析->ppt报告制作至少要一两周时间;而数据产品一旦建好,数据源一旦接入正确,数据模型足够完善,每次分析往往只需要几分到几小时。且无需重复提数,边际成本几乎为零!
6. 降低分析门槛:传统分析范式开展工作门槛较高,但对于企业如果想形成数据驱动的文化,提高数据驱动效能,应该让更多的人能够参与到数据分析当中。而数据产品恰好可以解决这个问题。一方面数据产品定义中就明确说明,是为了降低数据分析门槛,因此正常情况下理应以“小白”用户视角去设计产品,考虑用户体验、使用便捷性,易用性;另一方面(以可视化类产品为例)从认知心理学角度,可视化图表大幅提高了信息密度,通过颜色、形状等视觉化组件,快速将数据所包含的信息呈现给用户,大幅降低了认知成本。
04 好的数据产品有哪些特点
那么好的数据产品应该具有哪些特点?总体上至少包括4个维度:
1. 准确:这是数据产品的根本,是最重要的评价维度。因为一旦数据不准确,任何结论、应用、决策都可能是错的,成为空中楼阁。因此需要前期在数据源质量、指标计算口径上用心把控,确保精确。
2. 及时:无论是实时分析还是离线分析,都需要根据应用场景确保在必要的数据更新节点展示期望的数据。如果刷新时看不到数据或不是期望的时间窗口,使用体验会大打折扣。
3. 全面:由于受众较广,需要尽可能覆盖相关业务的全部核心指标及分析维度,实现“丰俭由人”,“一石多鸟”。
4. 易用:首先在产品设计时要充分考虑不同用户的使用经验和习惯,尽可能简单、步骤少、有引导,让用户用的“爽”,不要“反人性”;同时要定期对新老用户进行访谈或问卷调研,及时了解用户的使用反馈,及时优化,不断迭代。
数据产品实战案例
本节用少量篇幅介绍个人在数据产品领域的主要实战经历。
01 数据分析看板化
本人几年前以数据分析师入职京东。当时因为没有发现可用的可视化产品,只能通过Excel对不同列的数据进行原始的可视化监控。
现在看上去可能有点low,但毕竟也算一种可视化数据看板的雏形。令我印象非常深的是,当时同组的小伙伴看到后表示眼前一亮。当时也坚定了数据看板化的方向。
JA(京东分析师)产品出现后,尽管可视化功能不是非常强大,但还是做出了部门内第一个可视化日报。问题定位、数据监控效率有了质的提升!
大约两年前京东中台开发了一款敏捷BI工具,EasyBI(原京动力)。我很快成为重度忠实用户。两个月后搭建了部门内第一个(也是第一个PLUS业务,省钱攻略)EasyBI版本可视化数据分析看板,成为了敏捷BI的重要里程碑。
当时的产品同学看到后有如获至宝的感觉,强烈要求分享给PLUS全部业务方。也是从那时起,掀起了PLUS数据驱动精细化运营的浪潮。时至今日PLUS业务分析看板涵盖用户增长、货品运营、流量监控、营销活动、损益分析5大主题共计数十个可视化分析看板。
02 数据看板产品化
随着看板数量增加,使用看板的人数增加,基于EasyBI默认的看板管理模式遇到了瓶颈,看板内容及用户维护成本激增。为了解决该痛点,我想到能否通过类似门户网站的方式,让用户实现一站式访问目标看板,而无需维护看板名称-链接映射关系。经过一番设计,最终诞生了第一个EasyBI版可交互分析的看板门户产品,SMART-A。以下截图数据已脱敏。
坦诚讲,这个产品本身并不复杂,但确实可以让用户更快、更便捷访问看板,进一步提高数据分析效率和体验。EasyBI团队也在这个产品启发下,开发了一套通用看板门户搭建平台,方便更多部门搭建自己的看板门户。这个产品也获得了PLUS业务方真实的正面反馈。
“通过该平台及时获取push发送量级、点击率等核心指标是否正常”-用户增长组
“通过平台内不用消息的点击率,定位需优化的push类型,方便业务及时发现问题进行迭代”-会籍权益组
“相比日推数据,维度更多、指标更多,看数不用临时提需,可通过可视化快速看清数据”-产品组
目前PLUS业务负责人以及全部业务侧、产品侧、部分研发侧、部分测试侧同事都已成为该产品的用户。
此外用户还包括首页资源侧、黄金流程、消息推送等部门同事。
未来会基于用户真实负反馈不断完善产品,解决更多的“痛点”、“痒点”,制造更多的“爽点”。
总结
数据产品作为大数据时代的重要产品形态,不仅可以规避传统数据分析范式的弊端,同时可以:
放大分析的价值;
提高分析效率;
沉淀分析能力;
降低决策风险;
降低分析成本;
降低分析门槛。
未来在国内市场的潜在市场和增长空间依然很大,我很看好!
参考资料:《数据产品经理-实战进阶》
-END-