在数据分析过程中,经常会遇到数据源表中存在缺失值的情况,有可能是数据采集不完整,也有可能是数据输入的问题。这些缺失值会导致数据分析的结果不准确,从而影响决策的准确性。为了保证数据的完整性和一致性,我们需要对这些缺失值进行处理。
今天小九将介绍一种简单高效的方法,通过一步操作,按照上一非空行的数据来补全缺失值。
下面让我们一起看一个例子:
从其他平台导出的销售数据中,每个订单仅有第一行展示「订单编号」和「客户名称」,无法对数据进行计算,希望能把空缺的订单编号和客户名称补全。
在这个场景下,我们需要空白单元格获取「上一个非空项」,例如第 2、3 行的空白单元格获取第 2 行的「 A1000001 、邢宁 」这两个值:
1)利用「行间计算」功能先获取上一个非空项;
2)使用公式进一步处理:
IF(NOTNULL([订单编号]),[订单编号],[补全订单编号]),
如果本身有订单编号,仍保留本身的值;如果订单编号为空,那么填充补全的值。如下图所示:
「补全客户名称」字段同理,最终就可以得到两列正确补全的字段了。如下图所示:
模型复用
为了便于使用,九数云将「按照上一非空行补全数据」这个场景制作成了计算模型。点击即可应用。
应用模板后,将示例数据替换成您需要补全的数据,即可自动按照上一非空行补全数据。
总结
通过九数云提供的计算模型,我们可以简单有效地按照上一非空行的数据补全缺失值。在实际应用中,选择合适的缺失值处理方法对于保证数据分析结果的准确性和可靠性至关重要。
更多分析技巧,可以扫描下方二维码关注小九。
/END/