有一个数据表A,现在想对数据中第一次出现的数据和第二次出现的数据作比较,有用户ID和时间
我现在先创建了一个自建数据集B,通过汇总求和取出最早时间的用户ID
第二步想根据A再创建一个新的自建数据集C,然后将B数据集的数据排除
如果是sql的话肯定是not in (用户ID、时间)了,但是通过自建数据集怎么实现呢?
not in 的效果比较难搞,不过单纯想要对比第一次和第二次出现的次数的话,到不难,步骤如下:
1、直接创建自助数据集B,然后新增列-汇总值,分组字段选择用户ID,汇总字段选择时间,汇总方式选择升序排名
2、然后会得到一个用户按照时间的顺序的排名,排名为1的就是第一次出现的数据,排名为2的数据第二次出现的数据,在B的基础上新建一个自助数据集C和D,把排名1和2的筛选出来就行
目前好像不支持,可以合并数据集,但是不能排除。。。