一文快速入门数据分析师

楼主
我是社区第99661位番薯,欢迎点我头像关注我哦~
前言
        一提到数据分析,很多人可能脑海中可能会浮现出各式各样的数据画面。

        比如下图所示,这样的中国式复杂报表在企业中经常被使用,精密的复杂表格样式中蕴含着国人庞大的数据信息量。


        再比如这样的数据Dashboard可视化,通常应用于企业展示KPI业务指标,例如销售额、毛利率、利润率等等,数据的可视化呈现形式清晰直观。


        再就是目前火热的不行的企业数据大屏应用了,比如下图所示的双11全球天猫狂欢节当日的实时交易统计大屏,除了清晰直观地展示企业核心的KPI指标之外,狂拽炫酷是它至关重要的特征。


大道至简的数据分析方法
        但无论是以上的哪一种,无论数据如何变换,所有看似神秘的数据分析过程都可以归纳总结为各种“维度+度量”的组合分析。


        维度用于描述事物的属性信息,例如统计各个地区的交易数量时,地区就是维度。

        度量(指标)是可以量化统计的数值,例如统计各个地区的交易数量时,交易数量就是度量。但是需要注意的是并不一定所有的数值都是度量,例如学生的学号虽然是数值类型,但是其实它是维度而非度量。

        如此一来,我们对数据分析有了从整体上的解释。但是实际应用中,我们并非盲目地去进行各种维度和度量的拼凑组合,而是希望得出的数据分析结果能够指引业务进行决策,终而形成业务闭环效果的。

        根据笔者自身的一些数据分析项目经验,90%以上的企业实际数据分析问题都可以套用我总结的这七步完成:


        为了帮大家更快速地理解数据清洗建模和数据差异分析环节的内容,我这边以商业智能分析工具FineBI(感兴趣的可以到官网下载体验即可,个人完全免费)为大家进行一个销售数据分析实例,加深大家对数据建模和数据分析过程的理解。

一、确定分析目标
        这是分析前的第一步,我们需要明确进行数据分析的对象,也就是需要确定分析目标。

        通常来说我们会选取最关心的核心KPI指标,例如电商行业的销量、销售额、利润,制造行业的次品率,互联网行业的用户留存率等等。

        一般来说,分析目标不要过多,如果实在是需要同时分析多个关键核心业务KPI指标,那么我们便可以将这些核心指标分解给对应业务负责人,例如销售总监负责提升公司销售业绩,运营总监负责降低成本花费。

二、核心目标拆解
        确定好分析目标之后,通常来说我们需要再对核心目标进行子目标分解,这也符合企业各团队分工协作的特性。

        核心目标拆解的过程中需要遵循MECE原则,也就是“完全穷举,相互独立”。例如下图所示的电子商务数据分析指标体系,就分别从网站运营指标、经营环境指标、销售指标、营销活动指标、客户价值指标几个方面进行了详尽的拆解,然后交由各个团队进行分工达成。


三、数据清洗和业务建模
        确立和分解好数据分析目标之后,下一步就可以进入到数据清洗和业务建模环节了。

        数据清洗方面,很多人可能会想到国外传统的一些ETL工具,但是这类工具过于庞大和复杂,国内真正成功落地的案例很少。FineBI商业智能工具其实就提供了轻量级的ETL功能可供用户对数据进行计算和处理,鼠标点击和拖拽操作即可完成轻量的ETL数据处理过程。


        业务建模方面,FineBI也是提供了根据不同业务主题分类建立业务包的功能,一般来说按照维度表和事实表建立好关联关系即可,这样一来就为前端的数据差异分析准备好了数据模型。


四、数据差异分析
        终于到了数据差异分析这一步,这也是离发现问题原因和业务决策最近的一步。

        所谓数据差异分析,自然是需要有差异,才能有分析。

        例如今年某某企业7月份的销售额是600万,那么大家会觉得对于这个企业来说是好还是坏?如果只有这一个数据,自然是无所谓数据差异分析的。

        如果这家企业的6月份的历史销售额是400万,那么7月份600万的销售额自然是非常好的了,可是如果这家企业的6月份历史销售额是800万,7月份600万的销售额明显是有问题的。

a.纵向对比
        按照这个基础的数据差异分析逻辑,我们借助FineBI来初步分析一下某家企业今年各月度的销售额统计走势图:


        如上图所示,通过纵向对比不难看出该企业在7月份销售额下降严重,环比6月份的企业销售额下降了22.47%,不是个好现象。老板看到这个数据自然会前来问责,说为什么7月份公司销售业绩下滑这么厉害。那么会是什么原因导致企业7月的销售业绩相对6月下滑这么多呢?我们需要更新一步地进行数据分析,以排查出导致产生问题的”真凶“。

b.横向对比
      一般来说销售型企业都会在全国划分各个销售区域,那么这样一来我们除了对时间进行纵向对比之外,还可以结合销售大区维度进行横向比较,分析探索看看能不能发现一些问题。


        果不其然,如上图所示,通过时间维度结合销售大区进行横向对比发现,企业的东南大区7月份的销售额相对6月份反而是增长的,看来问题主要出在北方区和中西区,特别是北方区7月份的销售业绩下滑更为严重,最终导致企业7月份总的销售额比6月份严重下滑。


        由于FineBI是一款商业智能工具,故而我这边可以轻松通过其提供的OLAP联动分析功能,以更进一步的观察各个区域7月份的表现情况,直接点击饼图区域即可联动到月度销售额统计,非常方便。这边我们可以看出,中西区7月份销售额环比轻微下降17.86%,北方区下降严重到50.07%,而东南区则提高了6.06%,综合三个大区的总体销售状况,导致最终表现为7月份销售额环比下降了22.47%。

c.综合对比
        上面分析了时间、区域维度相关的销售额结果统计,为了避免结论片面,我们尽量采用多维度的综合对比方式来观察数据,甚至可以是友商的销售情况对比进行差异分析(此处不单独举例说明)。


       如上图所示,我们通过时间维度结合产品类型来进行销售额分析,观察7月份各个产品线的数据发现各个产品线在7月份销售额环比都是有所下降的,这说明企业7月份销售额下降和产品种类本身是没有关系的。

五、发现问题原因
        综合北方区域和中西区域导致7月份销售额环比下降的各种影响因素,最终发现是由于6、7月份北方区域降雨严重,导致物流周转严重滞后,库存商品无法及时供应,最终导致北方区域7月份销售业绩严重下滑了50.07%。而中西区域本身仓库比较小,按照之前各区域商品物流周转的设计,中西区域的本土供应的差额商品主要是由北方区域供应,但是北方区域由于严重的降雨导致物流周转严重滞后,进而导致中西区域7月份销售业绩也同比下滑了17.86%。

六、制定业务决策
        通过结合FineBI工具的OLAP多维数据综合分析方法成功定位到问题原因之后,企业及时调整仓库商品物流周转策略,北方区域物流模式调整为水运,同时将东南区域的部分商品通过物流周转到中西区域。

七、评估决策效果
        企业领导决策层8月份通过及时调整北方区域和中西区域的物流策略,北方区域物流模式调整为水运,东南区域的部分商品通过物流周转到中西区域,补充了北方区域和中西区域的库存商品周转。最终8月份企业的总体销售额达到了943万,环比7月销售额提高到了37.32%。

后记
        随着信息化的飞速发展,大数据产业呈指数式增长。在我们不断地积累着企业的历史数据的同时,如何利用和分析好这些数据,真正利用大数据分析驱动企业的业务增长也成为了一个很重要的难题。希望本文给大家分享的数据分析方法,结合FineBI商业智能分析工具的OLAP多维分析能力,能够让大家下次在面对企业业务数据分析时不再迷惑,做到步步为营,让数据分析真正释放出潜能,驱动业务快速增长,形成数据和业务之间的闭环。
编辑于 2018-8-9 09:14  
分享扩散:

沙发
发表于 2018-8-8 22:31:36
板凳
发表于 2018-8-9 00:45:48
地板
发表于 2018-8-9 08:17:45
太棒了
5楼
发表于 2018-8-9 08:22:21
6楼
发表于 2018-8-9 09:06:46
7楼
发表于 2018-8-9 09:11:26
8楼
发表于 2018-8-9 14:00:29
9楼
发表于 2018-8-10 18:28:56
10楼
发表于 2019-3-6 10:21:47
很好的资料
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表