4个九数云小技巧,让你轻松搞定数据清洗!

楼主
九数云--人人可用的数据分析及可视化工具

在处理表格数据时,不少小伙伴都会陷入重复性、“绕远路”操作的困境中,十分浪费时间。

其实,很多你需要的常用功能九数云都能一键实现。熟知以下功能,让处理数据这件事变得更简单一些。

1.删除重复数据

进行数据清洗时,我们首先最容易遇到的是“数据重复”问题。

例如,业务员重复提交数据、多人记录同一条数据......这些原因都造成数据表里有重复数据。

最终的数据中我想要删除重复的数据,根据 ID 和负责人的信息,一个公司只留下一条信息。

对于字段较少的场景,我们可以使用【分类汇总】功能,按照我们想去重的字段进行分类即可;字段较多时,可以直接使用【删除重复数据】快捷功能。

2.字段拆列

相信很多人都搜索过,如何实现Excel字段拆列吧?

现在,九数云把这个功能实现了,不用代码不用函数一键实现字段拆列

就以下图数据为例,希望按照“/”符号拆列:

借助「字段拆列」功能可以一步解决:

3.行列转换

行列转换的意义是将一维表和二维表相互转换,转换成更容易分析的状态。

拆行拆列则是将包含一个/多个分隔符/数组格式的字段进行拆分,拆分后生成多行/多列数据,方便后续分析。

一维表:也常被称为流水线表格。一般有固定的列名,平常输入数据只需要一行一行的添加即可。

二维表:是一种关系型表格,通常数据区域的值需要通过行列同时确定。更符合我们日常的阅读习惯,信息更浓缩,适合展示分析结果。

 

4.条件赋值

在处理大数据量的数据时,难免会遇到部分数据表达的意义相同,但由于细小误差,导致数据无法完全归类到一起,容易产生误差。

例如有上万种商品的sku,很难进行合并分析,需要将sku数据替换成对应的品牌信息就能够实现分析,能在九数云中我们也可以使用「替换字段-条件赋值」功能来解决:

利用「替换字段-条件赋值」则可一次性完成所有数据的替换:

5.数据处理

脏数据和不规则数据是我们数据分析前的拦路虎。无论你后续用什么工具来做分析,分析前的清洗工作和预处理工作总是必须要做且最让人心烦的事情,尤其是数据格式的标准化处理。

学完这一篇,下次遇到大数据量的表格处理,直接交给九数云,帮助你轻松搞定!

分享扩散:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表