通过KETTLE实现数据增量更新步骤。

image.png项目在建数仓,目前ODS层数据已经写好如上,后续需要进行增量更新,通过一个叫FMODIFYDATE的日期字段为条件进行增量更新。我没写过,有没有懂KETTLE的说一下步骤应该怎么写。FMODIFYDATE字段在数据同步中有。

努力学习中iii 发布于 2021-9-17 16:54
1min目标场景问卷 立即参与
回答问题
悬赏:3 F币 + 添加悬赏
提示:增加悬赏、完善问题、追问等操作,可使您的问题被置顶,并向所有关注者发送通知
共4回答
最佳回答
0
祈LLv6中级互助
发布于2021-9-18 11:57

kettle的这个插入/更新组件性能极低,建议使用时间戳增量更新,用update和insert来实现,不过就是要考虑历史数据修改补偿机制的问题

最佳回答
0
Z4u3z1Lv6专家互助
发布于2021-9-17 17:00
  • 努力学习中iii 努力学习中iii(提问者) 度娘看过表示每个例子都不一样,和度娘搜索出来的案例情况不一样。。
    2021-09-17 17:05 
  • Z4u3z1 Z4u3z1 回复 努力学习中iii(提问者) 那只有祝你好运了
    2021-09-17 17:08 
最佳回答
0
free_zzLv6中级互助
发布于2021-9-17 17:13

我觉得你 插入/更新 前面那部分全部都可以写sql来处理,增量就是往表里插入数据嘛,就每天查当天需要插入的数据就行了

最佳回答
0
Rose_RubyLv6初级互助
发布于2021-9-17 17:32

有临时表的话直接从临时表将数据抽取过去即可,然后抽取完了就将临时表数据清除;记录所有记录要有个时间戳,那么需要更新的数据也是一样直接抽取过去,数据直接冗余,使用时重复数据按最新的时间戳获取;如果需要清除数据,那么隔一段时间就启动另一个脚本,删除数据,只留时间戳为最新的数据,数据标识也可以添加,就看你想怎么设计表单

  • 4关注人数
  • 996浏览人数
  • 最后回答于:2021-9-18 11:57
    请选择关闭问题的原因
    确定 取消
    返回顶部