1. 概述
1.1 应用场景
在在构建数仓和中间库时,如果企业业务数据量级较大,可能会面临以下问题:
- 如果使用数据同步批量定时同步,数据很难做到高性能的增量同步。
- 如果使用清空目标表再写入数据的方式,面临目标表一段时间不可用、抽取耗时长等问题。
因此希望能在数据库数据量大或表结构规范的情况下,实现高性能的实时数据同步。
1.2 功能说明
FineDataLink监听数据管道来源端的数据库日志变化,利用Kafka作为数据同步中间件,暂存来源数据库的增量部分,进而实现向目标端实时写入数据。
支持对数据源进行单表、多表、整库数据的实时全量和增量同步,可以根据数据源适配情况,配置实时同步任务。