第18天知识点:数据集中如何标记重复值?
如何标记重复值,今天我们就来看几个实例。
案例背景:
有一张培训签到表,里面记录了参训学员的签到信息。
案例需求:
现在我们需要知道哪些学员是重复参加培训的,并且把他们标记出来。也就是想要达到下图这样的效果。
该怎么做呢?
案例分析:
重复参加培训,也就意味着学员的学号出现的次数大于1。
那出现的次数,也就意味着我们需要对学号进行计数。
分析到这儿,答案也就呼之欲出了。
操作步骤:
步骤一:新增汇总列,计算学号出现的总次数。
步骤二:新增公式列,根据学号出现次数判断是否重复培训,输入公式:
IF(学号出现次数>1,"重复培训","")
这样,就可以得到我们想要的效果了。
那么,问题来了。
案例背景:
上面我们是将重复参加培训的学员每一次签到都打了“重复培训”的标签,但其实在实际场景中,第一次签到并不算重复,所以不需要打标签,我们只需要对第2次及以上的签到记录进行标记就可以了,也就是想达到下图这样的效果。
案例分析:
以SH001这个学员为例,一共签到三次,其中:
2023-12-23签到1次,属于第1次签到,不需要标记
2023-12-25签到1次,属于第2次签到,属于重复参加培训,需要标记
2024-01-05签到1次,属于第3次签到,属于重复参加培训,需要标记
也就是说如果我们把每一次记录作为一次签到,那么按照时间顺序对应的累计签到次数是第几次,如果是第2次及以上签到,就标记。
那累计签到次数,可以想到什么呢?
没错,就是计算累计值。
操作步骤:
步骤一:新增公式列,将文本字段转化为数值字段,为后面计算做准备
(PS:这一步的目的是因为只有数值字段可以计算累计值,但原始数据中只有文本和日期字段,因此我们需要先将文本字段转化为数值字段再进行后续的操作。)
步骤二:新增汇总列,计算第几次签到
步骤三:新增公式列,根据第几次签到判断是否重复培训,输入公式:
IF(第几次签到>1,"重复培训","")
得到的结果就是这样。
以上呢,都是利用数据集中新增汇总列的功能。其实,在组件中,利用公式也可以实现这样的效果,感兴趣的小伙伴可以先试着操作一下哦~
答案我们会在明天揭晓~
标记重复值其实很常见,无论是标记全部重复值还是标记部分重复值,理解了其中的逻辑,就可以轻松的应对各种场景。
今天的学习内容就到这里,感兴趣的小伙伴自己动手试一试吧! |