admin管理员组文章数量:1664579
作者:JanieLiu
公众号《溜溜笔记说》
前言
数据分析涉及很多知识点,各个网站也都能搜到,但很少有一种系统化的流程来参考,也有读者后台留言问到数据分析的流程,所以我认认真真的整理出一套方法论,将数据分析从0-1的流程都串联了起来。
对于分析人员来说,过程很重要,是一个发现业务价值并探索业务价值的过程;但对于领导来说,结果才最重要,只有可落地实施可带来实际效益的结果才是数据分析价值的体现。
所以,流程中的每一步铺垫与探索都是为了最终的业务价值的实现。
一、 数据分析sop流程
数据分析共包括四大阶段:
- 需求处理阶段:考验沟通理解能力
- 数据处理阶段:考验数据清洗及sql、python等工具使用能力
- 数据分析与展现阶段:考验分析应用与可视化展现能力
- 复盘跟踪阶段:考验反省优化能力
根据数据分析的sop流程,将其中的数据分析与展现阶段整理了一份思维导图,方便大家快速理解,可以先看一下。
其实数据分析一句话总结就是:
将一堆无序的海量数据经过一系列清洗、处理、规整、加工展现,提炼出痛点及机会,从而驱动业务增长、辅助业务决策。
二、 展开讲讲数据分析各阶段
2.1 发现问题
问题千千万,需从中找出有效问题。
有效问题就是有价值的问题:这个问题涉及了什么业务?与什么指标相关?有多大的影响?能解决什么难题?受宏观影响还是微观影响?无法避免还是本可避免?等
发现问题,可以从以下几个方面着手:
- 与历史对比
- 与总体对比
- 与竞品对比
- 与目标对比
- 与经验对比
- ......
2.2 需求处理阶段
需求分两块:他人驱动与自我驱动。
➢他人驱动
通常由业务方、上级领导等需求方发现问题,提出需求。可能会存在需求不明确的问题,既增加沟通成本,又耗费时间成本,分析师将需求完成之后,需求方才发现自己需要的并不是这样的,成了无意义的工作、低成本的分析。所以需要清晰get到需求方的点,了解清楚需求背景、需求目的、指标口径、数据需求范围、数据需求维度、需求的期望排期等。
另外还需明确一点,数据展示聚合还是明细。如果展示聚合,需要按照什么维度聚合,按照什么方式聚合;如果需要展示明细,搞清楚为什么需要的是明细数据,因为明细数据量会比较大,既涉及数据安全,也给调取数据带来压力。有时候需求方要求明细数据,他们拿到明细数据之后还要再用excel去聚合去做数据处理,其实这一步骤分析师完全可以直接用sql或者BI产品解决。也就是说这个明细数据并不能一步到位让需求方看到他想看到的数据,所以需要引导需求方了解下他们需求的真正目的。
做到拆解需求,将抽象的需求具体化,复杂的需求简单化。
➢自我驱动
即分析师本人发现问题,探索解决问题的方案。
比如某个指标波动异常,先于业务方发现并解决问题;再比如专门负责某一个项目,主动通过数据探索项目优化方案。
自我驱动的精神难能可贵。
2.3 数据采集
数据采集的目的是为了在分析中使用,多数情况下用到的是聚合数据。
数据采集分为内部数据、外部数据两大块。
➢内部数据
1)需要梳理清楚这个需求需要什么数据
2)需要判别需要的数据是否能从现有数据库中获取。如果可以,应该从哪个库中的哪个表获取?这个表中字段的口径和需求所需的字段口径是否一致?
3)如果现有数据库中没有现成的数据可以满足需求,就需要梳理好口径请数仓同学重新落表。
4)如果现有数据库中有表可以满足,但是需要通过SQL层层关联才能从数据库中获取聚合数据,最好的方式请数仓同学将你所需的聚合数据落成数据库表,这样一方面你使用起来较为简单,另一方面也减少了数据展现层的BI端连接数据的压力。
➢外部数据
1)行业报告数据。比如艾瑞网、极光大数据、阿里研究所、199IT互联网数据中心等都会时不时的发一些行业分析报告。整个行业的数据公司内部是无法获取的,所以可以从一些行业分析
版权声明:本文标题:数据分析之落地sop流程 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dianzi/1730022851a1219662.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论