我一口气想了三个妙招,彻底搞定数据重复

楼主
帆软社群问答顾问; 入选2022年帆软产品致谢名单;

今日高考启幕,愿莘莘学子们笔下生花,心中有梦,一路顺风,金榜题名。加油!

今天小剑的心情是也满满的快乐气泡,开心的泡泡里就冒出了创意的小灵光!我迫不及待想要和大家分享几个FineBI数据处理的小妙招,重头戏是如何给数据集中的重复数据来个优雅的“消失”魔术!

让我们来快速预览一下“去重三部曲”,希望你们能爱上这些小技巧!

首先登场的是“重复侦测器”——只需一键,就能将那些影分身的数据一网打尽!

紧随其后的是“净化术”——一键施法,不仅能祛除重复数据,还能按照你的意愿选择保留第一份或最新版的记录,保证你的数据集始终保持最佳状态。

然后是“标记大师”——这个咒语无视版本限制,能让你灵活地标记并清除那些不速之客。

大家准备好了吗?让我们一起动手,把这些技巧变成我们数据整理的利剑!🗡✨

我为大家精心准备一份测试数据,公众号发送“重复数据”即可领取,也可从公众号消息窗口,点击进群交流”。

好啦,让我们正式开始吧,首先,我们将准备好的数据上传至FineBI的分析主题中,操作非常简单,就像下图这样:

准备好迎接第一招“重复侦测器”了吗?让我们一起揭开数据集中的秘密,找出那些完全重复的数据小精灵。

听起来是不是有点像魔法?但别担心,操作起来就像吹蜡烛一样简单,轻松又愉快!🔍✨

好的,让我们现在开始一场激动人心的数据集大揭秘!首先咱们得在数据集的最右侧加入一个神秘的魔法阵——“分组汇总”。别着急,这里有个小窍门:不要一根筋地一个字段一个字段去拖,太慢啦!就像打开宝箱的快捷键一样,点击数据集的第一个字段,然后按住Shift再点最后一个字段,唰!所有字段就齐刷刷地进入“分组”栏中红色的圈圈这里了。

接下来,就像选出最闪亮的明星一样,单独挑出一个字段,比如说“订单时间”,把它送到”栏上。在汇总方式中,记得选择“记录个数”——就像正确的魔咒一样,选对了才能点亮魔法。咱们一起来,让数据跳出来告诉我们它的秘密吧!🎩✨

此时可以看到我们汇总的这个字段值,是不是有点小激动呢?如果你发现里面有些数字超过了1,恭喜你,这就像是发现了隐藏的宝藏,意味着这条数据有着相同的兄弟姐妹,完全重复的记录呀!如果没有,那这条数据就像是独一无二的雪花,独特而没有重复。这样一探究竟,是不是感觉自己变成了数据侦探呢?🔍✨

 

小贴士:如果想知道还有哪些数据重复,此时增加一步,对刚才新增的的这个字段,做一次倒序排序 ,这样所有发生重复的记录就优先展示了哦。

好的,各位小伙伴们,系好安全带,准备迎接第二招——“净化术”的华丽展示!这个招数简单得就像变魔术一样,一挥手,所有的重复数据就消失不见了!请跟随我的步伐,在下图两个红色标记的地方——“删除重复行”。选中所有的字段,轻轻一点“确定”,嘭!所有的重复记录就像被施了咒语一样,烟消云散。简直不能更简单,是不是感觉自己就像个数据界的魔法师了呢?🎩🌟

 

 

哦,等等,还没完呢!“净化术”其实还藏着一点小小的魔法哦!想知道是什么吗?它可以聪明地帮你挑选并丢弃那些你不再需要的重复数据。比如说,如果你想保留按日期排序的最早记录,你只需在施展“净化术”之前,将数据按你喜欢的方式整理好序。这样一来,当你释放我们的魔法时,只有每组重复数据中最顶端的那一条会被保留下来。是不是觉得太神奇了?就这么轻松,还能这样玩!🎉📅

如果你心中还有那么一丝丝的疑问,想确认我们的“净化术”是否真的把那些狡猾的重复数据赶尽杀绝了,那就再次施展我们的神秘第一招——“重复侦测器”吧!再一次把那些字段排排坐,让我们的小魔法重新上场。这下,只要一瞥记录数的变化,就能立刻知晓重复数据有没有彻底告辞。如同魔术一般,一切尽在掌握之中!🕵️✨

 

介绍完了净化术”,它虽然很强大,但是对于6.0版本之前的小伙伴们却望而却步,怎么办?不用担心,接下来这一招标记大师才是终极操作。它的实现原理是,先将你所要展示的数据顺序编上序号,这样重复的数据必然会有:1,2,3,……这样的序号出现 ,此时,我们只需要增加一个过滤条件,筛选这个序号为:1,即可完美解决。

好,让我们把目光移回“净化术”。没错,它确实是一个强大的功能,但如果你还停留在6.0版本之前,可能会感觉有点手足无措,那该怎么是好呢?别急,接下来我要揭晓的“标记大师”技巧,才是你的终极秘密武器!

想象一下,你是一位艺术大师,手中的数据就像是一幅需要编号的杰作。把你要展示的数据按指定顺序排排坐,重复的数据会被赋予这样的序号,给它们编上:1, 2, 3, ……如此这般,然后,就像在画布上巧妙地添加一笔,我们简单添加一个过滤条件,只挑选序号为“1”的数据。这样一来,问题就被完美解决了,就像画家大师完成了他的杰作一样。简单,优雅,而又不失巧妙!🎨👌

准备好了吗?让我们一起揭开标记大师神秘的面纱,为那些还在使用老版本的小伙伴们带来一线光明!我们将采用一种古老而有效的方法,首先,创造一个神奇的辅助列“flag”,这一列的魔法数字全都是:1

 

接下来,我们要施展一个小小的魔法——“新增汇总列”。选择你想要去重的字段,然后对我们的“辅助列”进行一次累计操作。告诉你个小秘密,你还可以根据特定的字段进行排序累计,这简直是智能又方便!

这样一来,我们就能为重复数据赋予独特的编号了。只要数据一重复,序号就会跳出“1”的束缚,展现出大于1的数字。是不是感觉像是在玩一场数字游戏,既有趣又高效?🎲📊

现在来到了最激动人心的揭秘环节!接下来这一步千万别忽略哦。点击一下我们刚才操作得到的“重复编号”字段的表头,这里有个小技巧要展示给你。在筛选选项中,我们只选择那些值为“1”的记录,然后轻轻地点一下"确定"。

这个动作不仅帮我们检验了前面操作的成果,还顺带完成了数据的精准过滤。看吧,当一切尘埃落定,你会发现,那些烦人的重复数据已经一条也不剩了!是不是觉得既简单又超级实用?就这么轻松,我们已经清理得干干净净啦!🎉👍

 

 

瞧,就这么轻轻松松,带着一颗充满愉悦的心,我们优雅地甩掉了工作中的那些小烦恼。

朋友们,你们在使用FineBI时还遇到什么小挑战呢?快来评论区分享你的故事,让我们一起变困惑为清晰,把问题化为答案!🌟💬

分享扩散:
参与人数 +1 F币 +50 理由
苏瑞 + 50 【2024原创内容激励奖励】给你32个赞!

查看全部评分

沙发
发表于 2024-6-11 09:39:30
您好,您本篇文章是基于数据集中的重复数据,分享了几个FineBI数据处理的小妙招,整个内容都较为完善规范,但词藻过于花哨,可以稍微精简一下
板凳
发表于 2024-6-13 10:13:25
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表