发现异常数据?精准查找原因!

楼主
九数云--人人可用的数据分析及可视化工具

在分析数据过程中,你是不是经常遇到很多异常数据?

比如:

  • 某商店近一周成交量环比突然下降了10%
  • 某APP日活相比昨天下降了15%

那遇到这些数据异常我们要怎么进行分析呢?怎样能准确快速的定位到异常原因?

 

01数据准确性

首先在面对异常信息的时候,你需要先确认数据的准确性,也就是这个异常是否是真的「异常」

1、 确认数据埋点正确

数据埋点是我们取数的基础,确保埋点数据的正确性是数据分析首要做的事情。

例如某APP日活相比昨天下降15%,数据分析师Alice首先应该确认数据库中的埋点数据是否异常。

比如,是否是数据没有同步更新到最新、数据库数据字段类型是否正确、数据是否出现bug显示为空等等。

2、数据是否完整

因为大部分情况下,我们看到的数据是经过重重处理,最后以具体的数值、图表的形式出现在眼前的。所以在确认数据异常之后,最好是看一下数据源的数据量(例如分天统计最近5天的数据量,看数据量变化趋势)。

如果数据源也出现较大波动,则需要和运营侧了解他们最近都有什么动作,该动作是否会影响到数据,然后把相关情况和技术反馈,让他们确认数据源是否有问题;如果数据源浸问题,可以使用数据源直接统计相关数据指标,看看结果是否和反馈的数据情况一致,如果不一致,那就是数据处理过程中出了问题。这时候需要查明是数据处理的哪个步骤出了问题,并对数据做修正;如果数据一致那就要继续分析。

3、确认数据口径

出现异常数据的另一个可能性是你进行计算使用的数据表或者字段并不是目标计算需求应该使用的数据,因此了解数据埋点的含义并确认对你有用的数据字段也是非常重要的。

4、确认计算是否正确

理清楚计算的逻辑,错误的计算逻辑或者计算方式也可能是出现异常数据的原因。

 

02同期事件评估

在确认不是数据源层面的问题,也就是你发现的数据异常真的就是异常,这时候就对这个异常发生的时间节点下相关的一些时间进行分析,看是否是它们造成了异常。

以下是你可以考虑的一些同期事件角度:

03维度拆分分析

如果你发现同期事件并不是数据异常的原因,那么可以通过对数据展示的维度进行拆分来进一步分析。因为无论是什么指标其实都是可以通过公式或者多维度进行拆分的。

比如,每日充值金额=每日活跃用户数×活跃用户每日付费率×话跃用户每日人均充值金额。

如果每曰充值金额金额大幅度下降,可以分别看看每日活跃用户数、活跃用产每日付费率、活跃用户每日人均充值金额的变化情况是怎样的,从而确定具体是哪个小的指标发生了变化,导致数据异常的。然后和相关同事反馈,并了解他们最近有哪些动作可能会影响数据的。

再比如:某 APP 日活相比昨天下降了15%

  1. 将日活人群进行拆分,根据「新用户」「老用户」或者用户生命周期阶段、用户地域、用户来源渠道、用户使用手机型号等等进行拆分,查看不同人群的日活情况。

2、从时间维度,相比于昨天、上月下降了多少?同比、环比数据如何。

 

04总结

 

数据异常是每个数据分析师工作中最常见的问题,大部分人缺乏方法论,排查异常没有方向,随机检查几处,非常耽误时间,可能最后也没有准确结果。所以,需要认真去制定一套标准化流程去做这件事。通过上述方法,能够全方位地排查异常值,保障你的数据分析结果的准确性。

本文图表制作工具九数云免费使用链接:https://www.jiushuyun.com

分享扩散:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表