一份给数据分析小白的指南不畏浮云遮望眼只缘身在最高层

转行数据分析的路上,很多同学都有这些困扰“面对五花八门的学习资料,不知道从哪儿入手”“没接触过数据分析工具,担心学习起来很难”“没有数据分析

转行数据分析的路上,很多同学都有这些困扰

“面对五花八门的学习资料,不知道从哪儿入手”
“没接触过数据分析工具,担心学习起来很难”
“没有数据分析项目经验,害怕找工作被拒”

很多小白在刚接触数据分析的时候,缺乏数据思维的支持,做起分析来感觉找不准方向,很难通过分析挖掘出数据的价值。

为帮助大家更好的了解数据分析,快速补齐数据分析岗位所需能力,我今天给刚入行的新人们分享一种通用的数据分析思维,“Why-What-How”模型,这个模型在讲解概念和执行上是个不错的思维模型,在很多种分析场景都可以借鉴使用。本文将按照这个模型框架来拆分数据分析帮助新手小白更好地理解数据分析师这个岗位。

WHY:为什么要做数据分析?

数据分析是为了能以量化的方式来分析业务问题并得出结论,其中有两个重点词语:量化和业务。 量化是为了统一认知,并且确保路径可回溯,可复制。除量化之外,另外一个重点词语是业务。只有解决业务问题分析才能创造价值,价值包括个人价值和公司价值。

那么,如何站在业务方的角度思考问题呢,总结起来就是八个字:

忧其所虑,给其所欲

  1. 沟通充分
  2. 结论简明
  3. 提供信息量及可落地建议
  4. 寻求反馈

在沟通上,确定业务方想要分析什么,提出更合理专业的衡量和分析方式,同时做好节点同步,切忌一条路走到黑。举例来讲,业务方说要看页面停留时长,但他实际想要的,可能是想衡量用户质量,那么留存率、目标转化率才是更合适的指标。

在阐述分析结果上,要记得结论先行,逐层讲解,再提供论据。因为业务方或管理层时间都是有限的,洋洋洒洒一大篇邮件,未看先晕,谁都没心思看你到底分析了啥。

在提供信息量及可落地建议上,先要明白什么叫信息量:提供了对方不知道的信息。太阳明天从东方升起不算信息量,从西方升起才是。

WHAT:什么是数据分析?

数据分析的本质是抓住变与不变。“变”是数据分析的基础,如果一个业务每天订单是 10000 单,或者每天都是以 10% 的速度稳步增长,那就没有分析的必要了。而若想抓住变,得先形成“不变”的意识。

因此,我建议新手要形成习惯,每天上班第一时间查看数据:实时&日周月报;记录关键数据(榜单&报告)。在“不变”的基础上,便能逐渐培养出指标敏感性,即意识指标偏离的能力。这主要是通过各种日环比,周月同比的监控以及日常的好奇心来保持。

HOW:怎么进行数据分析?

下面我将从数据分析师的类别,需要掌握的技能以及工作日常三方面进行讲解。

1、数据分析的类别

科研数据分析:模型非系统化,纯粹学术,实际应用很难落地;要求编程能力极强,模型理论能力极强

业务数据分析:非系统化,纯粹业务,无需要求编程能力,模型较为简单

数据挖掘解决方案:系统化,糅合学术与业务,要求编程能力中等,模型理论能力中底下

一般来说,业务数据分析应用场景广泛,更适合职场人士。

2、数据分析师需要的技能2.1 统计学与概率论

统计概率是数据挖掘理论知识的基础。在日常的数据分析工作中,常常会用到统计概率论的知识。统计概率涉及到的条件概率、概率分布,统计检验等知识是学习数据挖掘必备的先验条件。

书籍推荐:《深入浅出统计学》《统计学-从数据到结论》

2.2 思维逻辑能力

想要从事数据分析一职,最重要的就是要拥有数据分析的思维,很多小伙伴上来就学习各种工具和编程语言,但是发现学会了这些编程语言之后依然不会数据分析。数据分析的思维也不是一蹴而就,需要慢慢积累,多学一些分析的模型,多看一些数据分析的案例,以下是小编整理了数据分析常用到的模型。

由于不同版本的演绎,造成了分析方法种类繁多,令人眼花缭乱,甚至高深莫测。其实真不用把分析方法看的太高大上了,所有的分析方法总结起来就两种:分类和对比。

2.21 对比分析

顾名思义就是将两个或两个以上的数据进行比较,分析它们之间的差异,从而发现数据的变化情况和规律。对比分析法分为静态比较和动态比较两类,用来判断某个数据是好还是坏,以及某几个数据之间的差异性。

一般在数据分析中我们可以从这样几个角度进行对比:

  • 时间对比:同比、环比、变化趋势
  • 空间对比:不同城市、不同产品对比
  • 目标对比:年度目标、月度目标、活动目标
  • 用户对比:新用户 vs 老用户、注册用户 vs 未注册用户等
  • 竞品对比:渠道、功能、体验和流程、推广和收入

2.22 分类分析

分类分析就是把分析对象总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,保持各组内对象属性的一致性、组与组之间属性的差异性,以便进一步运用各种数据分析方法来揭示内在的数量关系,最终目的是为了方便对比, 所以经常和对比分析法一起用 。

分类分析一般有以下几种分类方法:

  • 不同时间分组:日、周、月、年等
  • 不同产品类型分组:产品属性;产品区域
  • 不同用户类型分组:人口属性(性别、年龄);客户价值;消费频次
  • 不同渠道分组:线上渠道、线下渠道;付费渠道、免费渠道
2.3 业务知识

数据分析是用来解决具体行业问题的,需要从业务的角度出发了解各个指标,以及每个指标之间的关系,还需要联系业务去理解数据。所以,工作中数据分析脱离不了业务,在分析中要找到导致问题发生的根本原因,而不只是单纯的统计数据。

业务知识包括某个行业的常用指标、业务流程。需要注意的是,不同行业的指标、业务流程是不一样的,所以需要学习的时候针对你的目标行业去学习准备。如果是刚入门,这块内容做到了解即可,等进入工作以后,再慢慢深入业务,积累业务经验。

下面列举了工作中常用到的指标(部分):

2.4 必备工具

由于需要处理大量的数据,所以在分析数据时经常使用专门用于分析的工具。由于在数据分析过程中进行的分析计算非常复杂,因此使用分析工具可以实现高效计算。

每个公司使用的分析工具各不相同,如果对编程觉得有困难的小伙伴可以选择SPSSPRO。

3、工作日常

经过前面的分析,我们从整体上知道了数据分析师需要掌握的能力。但并不是说,这些能力全都掌握了你才能找到一份数据分析师的工作。因为不同的职位的要求不一样的。

下面我们首先看看数据分析的工作内容是什么样的?针对不同的工作内容,我们来谈需要掌握的技能程度。

数据分析师的日常工作内容可以大致分为以下三类,每个类型给出了相应的场景方便大家理解,通过这些常见的数据分析场景,你就可以获得数据分析项目的基本流程。

3.1 日常运营——基础性工作

3.11 基本统计指标

数据指标是通过对数据进行分析得到的一个汇总结果,是将业务单元精分和量化后得到的度量值,使得业务目标可描述、可度量、可拆解。

如对一款软件来说,其常见的指标包括:每日活跃用户数、新注册用户数、次日留存率、七日留存率等。

数据分析前需要确定使用哪些指标去衡量业务成果。例如,针对一个APP产品来说,每当运营上新功能或新活动时,就需要去确定该用哪些指标去衡量这些功能或活动的效果;若后续要做一些深入分析的话,还需要考虑设计一些更深层次的指标。

但数据指标体系的搭建并不是单个部门能够完成的,应至少有业务团队(包括市场、运营、产品等)、数据团队以及开发团队三个团队的共同协作。

3.12 报表开发——制作日常日报、月报、周报

图中展示的是11月TOP10 热销产品情况,这是专门向领导汇报当月工作的内容, 告诉领导业务线的发展情况。如果在公司中只是处理类似这样的需求,数据源多数是在公司某个系统上进行下载成 excel,然后用 excel + PPT 就可以完成。

技术要求:可以使用数据处理、pro绘图、ppt写分析报告即可

业务要求:对于新手同学多做几个开源的项目,明白常规的分析思路就好

3.13 可视化看板代替上述的日报、周报、月报

当公司认为数据发挥的价值越来越大,业务需求也越来越多的时候,会发现写日报、周报、月报这样做需求效率太低了。可能会考虑使用 powerbi、tableau 这样付费的可视化软件进行需求开发。如下图,制作成这样的可视化看板,不管是业务同学还是上级领导,都会很方便的得到各个维度的数据,还能实现业务同学的自主分析需求。

看板搭建主要以“简单高效”为主要目标,一般来说,需要满足以下几个设计要点:

  • 优先满足查询效率,而非炫酷的人机交互。
  • 搭建不同看板时,要实现高聚合低耦合;每个看板中的数据信息需要具有强关联性,如利用环比、同比来体现相关性与变化性。
  • 根据业务需求确定数据图标的刷新频次与统计频次,最好能做到实时更新。

业务要求:能够掌握当下业务的流程、另外公司也会有相应的产品经理会和你一起定下需要的数据指标,难点在定下的指标要能实现。

3.2 分析建模工作

3.21 专题分析

根据特定问题分析,比如某公司领导提出过度降价导致洗发水 A 的年度利润下降这样的一个需求,然后让你来具体分析下。

针对领导提出的需求,开始提出上文所示的假设,并作数据处理,看到这里的同学希望先停留几分钟想下,为什领导会认为是过度下降导致了利润下降了呢?难道是领导是看到洗发水 A 全年利润下降,并且对当时降价运营活动印象深刻,就是暂时这样认为的吗? 其实经验丰富的数据分析师会站在和领导一样的高度上来考虑问题,把问题会进行转变,如下:

其实领导的问题应该是洗发水 A 的年度利润未能达到要求,让数据分析同学找出原因的。如果从事数据分析一段时间后,脑子中对于业绩下滑这样的专题分析,会很快的想出4p 营销理论,直接从产品、渠道、促销、价格全面的进行考虑,不会有遗漏。所以正确的提出假设应该是这样的:

那么大家感觉这块需要什么技能呢?只能说是常年积累的业务知识以及分析方法

3.22 探索/诊断分析

如果某个指标出现异常要怎么排查:

  • 第一步:确认数据真实性
  • 第二步:根据几个常见维度初步拆分数据(外部因素)
  • 第三步:异常范围定位后,进一步做假设
  • 最后:细分假设,确立原因

案例:如何分析次日留存率下降的问题

业务问题关键是问对问题,然后才是拆解问题去解决。

(1)两层模型:从用户画像、渠道、产品、行为环节等角度细分,明确到底是 哪里的次日留存率下降了

(2)指标拆解:次日留存率 = Σ 次日留存数 / 今日获客人数

(3)原因分析:

1)内部:a. 运营活动 b. 产品变动 c. 技术故障 d. 设计漏洞(如产生可以撸羊毛的设计)

2)外部: a. 竞品 b. 用户偏好 c. 节假日 d. 社会事件(如产生舆论)

(4)计算总留存下降量、abcd 四个渠道下降量,做比例

3.23 预测性分析

预测分析即根据往期数据进行预测,从描述性和诊断性分析中总结数据结果影响因素与发展态势,以了解可能发生的情况。

对于未来数据的,举个例子,比如预测电商网站用户的流失分析,并挖掘出影响用户流失的关键因素。这块内容就是要涉及到算法使用了。

技术要求:

  • 常用算法:逻辑回归、决策树、随机森林、xgboost
  • notebook能够熟练使用

业务要求:

能够明白公司相应业务流程即可,一般公司里面会有一到两周的熟悉业务的时间。

3.3 撰写报告工作

撰写数据分析报告可以说是数据分析师最核心的工作,是数据分析师核心价值的体现,常见的报告包括以下3种:

  • 日常分析:一般按照周、月、季度、年等时间段定期举行。是以定期数据为依据,反映计划的执行情况,并分析影响和形成因素的一种数据分析报告。一般包括:计划执行情况、超前完成/滞后完成的原因、存在的问题、成就与经验、措施和建议。
  • 专题分析:针对不同的业务主题进行分析,是为决策者制定某项政策、解决某个问题提供决策参考与依据。常见主题包括比如增长分析、内容分析、新用户承接分析、流失分析等等,这些主题可以是业务方向你提出,也可以是你通过观察数据自己发现问题自己分析。
  • 综合分析:是对一个地区、单位、部门业务等发展情况的全面综合性评价报告,如某部门的运营分析报告,可利用4P分析法,从产品、价格、渠道、促销四个方面对企业运营进行分析。
总结

数据分析的目的是为了更好的支撑业务发展,通过数据收集(数据埋点等),分析数据之间的关系(建模、搭建指标体系),反馈到目标业务线,用于指导业务工作。做数据分析首先数据准确性是第一位的,然后就是要站在业务方的角度思考问题,忧其所虑,予其所欲,这样做出来的分析更容易产出价值。

原文链接:http://www.wanshiruyi.cc/news/38996.html,转载和复制请保留此链接。
以上就是关于一份给数据分析小白的指南不畏浮云遮望眼只缘身在最高层全部的内容,关注我们,带您了解更多相关内容。

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。



上一篇:弘景光电IPO:和老东家“抢饭碗”,高增长背后隐忧重重金粉世家主题曲

下一篇:一文梳理海外小游戏生态:传统页游退场,嵌入式平台兴起网络游戏角色名字

相关推荐