7

通向优秀数据分析师的6个阶梯

 2 years ago
source link: https://www.yunyingpai.com/data/751953.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

很多同学都在问:”数据分析从0到1的文章看多了,咋样才能从1到10,从普通到优秀呀!”这篇文章作者系统地讲述了6个阶梯,助你成为优秀数据分析师!

p7wNSlwIWJ3jry8dhEWF.png

很多同学都在问:”数据分析从0到1的文章看多了,咋样才能从1到10,从普通到优秀呀!”今天系统地解答一下。“优秀”是一个形容词,只有清晰了参照物,才能知道到底什么是“普通”,什么是“优秀”。今天就从“普通”讲起,想通往“优秀”,需要迈过6个阶梯。

一、搞数据

数据分析最怕啥?没思路?没模型?没图表?

数据分析最怕:没数据!无论是做啥分析,搞数据,始终是第一位的工作。尽可能多地搞数据,是第一位要求。不然一切免谈。

只不过,同数仓开发不同,数据分析关注的数据,是面向业务主题的。数据服务的产品、运营、销售、营销、售后部门,到底有什么数据,需要什么数据,是数据分析师必须梳理清楚的。

具体来说,包括:指标/维度两部分。如何衡量是否清晰?可以问自己,以下九个问题是否清楚。

  1. 我服务的部门是……
  2. 该部门属于利润中心/成本中心
  3. 该部门的KPI指标是……
  4. 该部门的主要流程是……
  5. 该部门流程中,已采集数据是……
  6. 该部门现有过程指标是……
  7. 该部门组织架构是……
  8. 该部门服务对象分类是……
  9. 该部门常用分类维度是……
  • 1、2、3是用来明确主要KPI指标的,这是数据分析的源头和关键
  • 4、5、6是用来搭建过程指标体系的,解释KPI指标如何达成
  • 7、8、9是用来筛选关键分类维度的,当KPI指标波动,从这些维度做拆解

很多同学习惯于在现有宽表上跑数,向上不清楚业务流程、业务目标,向下不清楚数据来源、数据采集,每天忙着按需求单跑数,连跑的数是啥意思都不懂。这样就限制死了自己的发展空间,无法进一步提升能力了。

通向优秀数据分析师的6个阶梯

二、定基线

做到第一阶,至少能看懂自己跑的数据了,知道每个数据是用在哪个部门,哪项工作。下一步最关键的是……?

有的同学可能不假思索地说:建模!还没到这一步哈。下一步关键的是:定基线。知道自己看的数据,常规形态是啥样的。知道什么算正常,什么算不正常。

这一步非常重要!因为数据本身没有含义,数据+标准才有含义。而并非所有指标,业务方都会给出标准的。很可能,只有销售数据才有具体到每天的考核标准,其他数据得凭经验、凭常识、凭分析定出基线(如下图)。

通向优秀数据分析师的6个阶梯

很多同学无法解读数据,做的分析不被业务认可,都是因为没有跨过这一台阶。最常见的,看到指标跌了,盲目做了一堆交叉,然后业务方轻飘飘地:“这是正常波动”。

然而第二天又有同样幅度波动,业务方却急着烟熏火燎:“这么大波动你都看不到吗!”……被这么折腾几次,就会信心全无,怀疑人生。所以想进步,就不能被业务方牵着鼻子走,得自己有定基线能力。

三、拆因素

跨过第二阶后,数据分析师已经对业务常见走势,有充足的了解。并且,自己有能力做判断,就能识别出异常状态。并非所有的异常都不可控,有相当多的异常是可观测因素导致的,比如宏观环境,比如营销动作、推广计划。此时,要先有能力先把这些明显可识别的“白犀牛”整明白,再来谈其他“黑天鹅”问题。

看到这里,肯定有同学会说:“老师,这个简单,我的PEST,SWOT,4P已经按捺不住了,来吧!”然鹅,没卵用。你看那么多PEST的文章,有一篇教过你怎么量化P、E、S、T四个指标不???

通向优秀数据分析师的6个阶梯

所以这一台阶,叫“拆因素”,即把这些影响业务的因素,拆解到可以量化的,能用一个或几个数据指标表现,并能与内部数据结合分析的程度。拆因素可能有若干数据形态,比如:

  • 1、0、1形态:有XX因素、没有XX因素
  • 2、分类形态:同一事件,ABC三种状态
  • 3、连续形态:能用一个连续型指标,代表该因素

具体怎么拆,是需要大量分析工作做基础的,最后能沉淀下来的,就是最有价值的经验。

通向优秀数据分析师的6个阶梯

四、测细节

跨过第三阶段后,数据分析师能对明显的,重大的影响因素做出判断。想要进一步提升,就得深入到细节中,了解活动到底怎么做的,产品到底怎么设计的,用户到底需求什么。这些已经触及业务的核心,因此很难短时间内搞清楚,需要长期积累。

想做这一步,有2个关键工作要做。

1. 打标签

越是触及业务核心,连续型指标能描述的情况就越少,越需要打标签。类似用户情绪、喜好、产品功能点、营销逻辑,都是靠标签来描述和量化的。准确地打标签,将业务量化,做出清晰的分类,是高级数据分析师的技能。不是说把数据库里的,现有的维度表拖出来就完事。

2. 做实验

可能有同学会说:ABtest我现在也经常干,为啥感觉不到进步呢。注意,现在的ABtest,很多是产品驱动的,不是数据驱动的。鬼知道产品经理从哪里搞了2个版本,扔过来就测,然后让数据分析师解释差异。这是非常本末倒置的,只会让人陷在琐碎的数据里。

一个正式的实验,是:

  • 有清晰的改进目标
  • 有清晰的改进逻辑
  • 有关键改善过程指标
  • 有环境控制变量
  • 有组间差异预判

通向优秀数据分析师的6个阶梯

谋定而后动。这样才能在解读实验数据的时候剔除各种杂糅因素,得到正确结论。当然,想做到这一步,需要业务的配合和参与。如果业务真的很喜欢自说自话,就靠数据分析师个人能力,至少推动剔除一些明显容易杂糅的因素。

五、理逻辑

迈过第四个台阶,数据分析师本人已经可以实现:描述问题-发现问题-解释问题-检验效果的闭环了。单纯站在数据角度,已经是个完整的能力闭环。

但仅有数据能力闭环是不够的,因为在企业里,相当多的问题不是来自技术,而是来自业务。更有甚者,是来自业务方的屁股决定脑袋,来自业务方急功近利、大干快上,来自业务方事前拍脑袋,事后拍大腿。

因此想要让数据更好地展现价值,就得有能力应对现实问题。在千头万绪中,梳理清楚问题逻辑,找到正确的答案,或者至少给自己找到脱身的办法(如下图)。

通向优秀数据分析师的6个阶梯

这时候“理逻辑”,重点是把口语表达的,不可量化的业务逻辑,转化成数据可验证的逻辑,并且选择合适的数据方法得出结论。除了数据能力,还需要数据分析师有业务洞察,有一些职场沟通技巧,才能完成任务。

六、组模型

有了以上五个阶段的积累以后,你已经能完全在一个行业里混得如鱼得水了,不但能做好基础数据服务,也能协助业务做出业绩,更能以客观中立的态度赢得老板的信任。
此时,可以更进一步,提炼一些属于自己的模型出来:

如果用少数关键指标就能概括这个行业的问题,可以捏个业务模型

如果某个业务场景,用特征+算法能得到很准确的预测结果,就固定成该行业算法模型。
搞完了,记得也取四个英文字母做名字以体现档次。

做这一步,不仅是为了沉淀经验,提升逼格,更是为了迁移知识,扩展使用范围服务的。很难保证人一辈子都不换行,掌握了优秀分析能力的人,干一行就是一行专家。而迁移知识,靠的是模型的总结与经验积累,两者缺一不可。

纵观整个成长阶梯,核心就是:数据分析师要能剥丝抽茧的解决复杂企业问题,这样培养能力,才是我们自己安身立命的法宝。

很多在校的,刚毕业的同学们,还习惯于沉浸在书本中,总觉得越难的知识越牛逼,一本统计学有19章,那第19章肯定比18章牛逼……这样单纯堆叠知识点,可以无穷无尽卷下去,但是对于提升实际能力帮助甚小,非常不推荐哈。真有兴趣搞这些,推荐去纯科研。

特别是,数据分析本身就是一个面向不确定性,用数据方法解决企业经营不确定性的工种。把数据采集上来,服务好管理层,推动业务实现业绩,至少就有一个公司数据部门总监位置在召唤,合理而不为呢。与大家共勉!

作者:接地气的陈老师来源:公众号:接地气学堂

本文由 @接地气的陈老师 原创发布于运营派。未经许可,禁止转载。

题图来自 Unsplash,基于CC0协议。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK