热搜:

咱接着昨天的内容继续聊。还是从宋世君大佬分享内容中获得的灵感。有个同学是这么问的:

世君老师好,我想提问:作为数据分析师如何检验自己的水平或者能力?因为数据分析师个人认为最重要的是思维,但是思维又是一个很虚的内容,不像研发岗位,有非常确定的知识体系。

这个问题很有意思,宋世君大佬是从数据能力层面上解释的,我就不狗尾续貂了。我们今天来聚焦一下“数据分析思维”。欢迎大家加我微信:shirenpengwh ,一起探讨大数据相关技术。每天一篇原创,分享给大家,我们一起学习,共同进步。

数据分析思维不是什么

但凡要是问一个数据分析师,他肯定可以给你扯出来一堆的内容。比如:一定要看数据!要数据指导运营!要数据化管理!要科学决策!

抱歉哈,这叫口号。而且这些口号除了咱数据分析师之外,别人都不会真正放在心上的。

有算法的同学深思熟虑了一下,说:数据分析思维就是信息、情报思维,获取更多信息,知道更多的细节,然后作出合理的推断。

这个回答好像很赞哦!不过,这些不是数据分析思维本身,而是它的目标。如果把目标当做思维,每个八卦er都是数据分析师,那些狗仔队简直可以成为数据分析大神了!甚至娱乐界还有“谣言”=“真相”的说法。

也有数分的同学会给出比较干的内容:数据分析思维就是细分、对比、结构化、递进、相关性,是AARRR、是漏斗模型等等。这个就比较接地气了。可不是么?我们做数据分析其实说来说去也就这些手段。

这对吗?也不对。这些都是实现的手段、方法论,是属于“术”的层面。

技术同学站出来了,那就是做各种数据产品,什么固定报表、多维分析、即席查询、大屏展示一应俱全,做到数据即是服务,这总该对了吧?

这也只是数据分析的工具而已,是“器”的层面。数据产品做好了,肯定是能提升数据分析的效率、增强数据分析的能力。

数据分析思维是什么

以上的口号、目标、手段和工具,都不是数据思维,而是数据分析的一个个的侧面。

我们继续思考:这一切的本质到底是什么呢?前面好像没路了。

好在我们有万能的哲学。我们得借用一下哲学的研究方法:

抽象是哲学的根本特点。一切具体的存在和发展都必须遵循抽象的规律;一切具体的应用学科都应该遵守抽象的哲学原理,但这必须以哲学原理的正确性为前提。

好,就用抽象这个工具继续思考,我们先总结、归纳,然后再抽象,这是自下而上的归纳法。然后抽象出来之后,再自上而下的往下演绎,验证一下我们思考的结论是否正确。

因为是归纳法,那这些东西要多少有多少,穷举当然是一个好办法,但是篇幅有限,我们选择最优代表性的就行了。

  • 我们先把各种AARRR、RFM、帕累托、四象限等抽象一层,就得到了业务分析模型,是用一个个固化的结构来解释数据表现;

  • 我们把聚类、分类、预测等抽象一层,就得到了算法模型,是用一个个数学公式来实现数据的演化;

  • 把对比、细分、结构、递进抽象一层,就是数据分析方法,是用一个个技巧发现数据表达的内在含义;

  • 把数据地图、固定报表、多维分析报告、大屏、A/B Test抽象一层,就是数据分析工具,是用一个个系统提升我们分析的效率。

我们把业务分析模型、算法模型、数据分析方法、数据分析工具等再抽象一层,是什么?

有同学瞬间就通透了:哇,这不就是数据分析思维吗?抱歉,我们不需要名字。抽象一层之后叫啥其实无所谓,叫数据分析思维、叫数据思维、叫干饭思维都无所谓。我们真正在意的是再抽象一层之后,这一层的核心意义是什么?

我思考的结果是:不管是用业务模型来解释数据表现、还是用数据公式实现数据的演化、还是用技巧发现数据表达的含义、抑或是用工具提升我们数据分析的效率,本质上都是在做同一件事:一刀劈开是非对错。

建模

很多数据分析高手都曾说:数据分析其实就是把定性的事情转变为定量,这样我们就能够更具象化、标准化,能横纵对比,能细化放大,能把复杂的事情简单化。

这很对,也是数据分析的核心价值所在。

但是!我们量化分析之后呢?做什么?还是得回到我们最终用户身上,告诉他,这样好,那样不好,为什么。这么对,那么不对,为什么。

很多数据分析师还总结一个原则:只描述事实,不做判断。其实我认为不太恰当。在量化阶段的确需要这样做,但是在往下落的时候你还是只描述事实,不做判断,这样是没信服力的,价值也有限。另外还有一个恶果,就是描述事实谁都会,业务/运营就会说:你把数据给我就好了,我自己看。

所以我们必须要有这惊天一刀,劈开混沌,分清是非对错、好坏善恶。数据领域本来就有这个词,这就是“建模”。

本来想举几个例子,可是自己公司的例子不能举,别人公司的例子又拿不到,非常恼火。不过有个非常好的角度可以给大家剖析一下举例子一定要真实的吗?未必!我们既然是想证明“一个模型如何说服别人”,那么反面的例子也是OK的,对不?

比如最典型的沃尔玛“啤酒+尿布”的虚假案例(注1),到现在仍然是大数据发现商机的典型案例。他们就是通过“啤酒+尿布”这个奇特的建模角度告诉大家这样的商品组合很好。你看,用户很买账!没有人在乎这是一个虚假的例子!但是如果你给一张表格,然后读数,用户大概率会开始低头玩手机的。

这一点我们确认之后,再往下演绎试一下。既然数据分析思维的核心是一刀劈开是非对错、好坏善恶,套用一个词就是“建模”。那数据分析思维往下细化应该有哪些呢?

其实我们想来想去无非还是那些,方法论、资源、流程、工具、原则等等。那再往下拆解呢?当然也能拆解出来很多内容了,比如:

总结

OK,回到最开始那位同学提到的那个判断:“数据分析思维又是一个很虚的东西...”

数据分析思维很虚吗?在我看来,非常的实!无比的扎实。数据分析通过量化,把大众认知中的定性思维转变为定量思维,从而让我们更容易理解数据、看懂数据、比较数据。但是我们千万不能站在量化的高台上俯瞰用户,这样用户会离你原来越远。

我们还需要加一步,对数据和业务进行建模,一刀劈开是非对错,好坏善恶,回归到用户的二元认知中。告诉他们这个好,那个不好,为什么。这样用户才会信服你,认可你,接纳你。我认为这才是数据分析思维的核心奥义。

注1:Daniel J. Power:What is the "true story" about using data mining to identify a relation between sales of beer and diapers?

(http://www.dssresources.com/newsletters/66.php)

-END-