yzmXz2z20249308的帖子

一月更新 | 实时数据同步新增SAP HANA、Db2等数据源、数据开发并行取数功能上线！

4.0.26 版本已发布，本次更新内容为： 1、【数据源】管道任务支持SAP HANA读取 2、【功能】定时和管道提供高级建标特性 3、【功能】支持Hive分区表创建和写入 4、【功能】支持利用并行取数提高读写效率 5、【功能】定时任务支持调用数据库存储过程如果你想了解更多详情，请点击：「产品更新」新增BI公共数据作为数据源、并行取数提高数据读写效率、存储过程调用增强等 (qq.com) 一、数据源 1、管道任务支持SAP HANA读取数据 SAP是一套被企业广泛使用的ERP系统，大多数企业会为了业务更灵活地数据分析，需要将数据导出后自行分析，一般会选择调用RFC函数或配置SAP HANA数据源- FineDataLink帮助文档进行定时取数。4.1.4版本开始，数据管道来源端支持SAP HANA数据库，用户可以通过管道任务对接SAP HANA实时取数，从而满足企业对更高时效性的需求。数据管道配置数据源 💠详情：支持的数据源范围- FineDataLink帮助文档 2、将BI「公共数据」作为数据源从4.1.3版本开始，在数据源处提供BI公共数据，支持读取多个 FineBI 工程的数据，同时支持通过指定用户账号密码限制权限，保障使用安全。 ● 数据连接处配置数据源 ● 数据开发通过「数据同步」或「数据转换-数据集输入」可直接选择“公共数据” 数据来源远程公共数据选项 💠详情：配置远程公共数据源- FineDataLink帮助文档 3、定时和管道提供高级建表特性从4.1.3版本开始，在数据处理进行表输出时，在自动建表时提供建表功能以增加更多自定义特性，例如：定义表编码（UTF-8、ASCII等）、添加索引（帮助快速定位表中的特定行）、定义建表的类型（列式存储、行式存储）等，此功能同时应用于数据开发和数据管道。手动建表配置 💠详情：类型数据同步功能说明- FineDataLink帮助文档 4、Hive分区表创建与写入从4.1.3版本开始，面对Hive大数据量的数据存储情况下，一般通过时间、地理、类别进行分区，提高查询速度。在FDL4.1.3的定时任务中，提供Hive在自动建表时支持分区表的创建，提供更好的“一站式”操作体验。数据同配步置分区表 💠详情：读取、创建、写入分区表- FineDataLink帮助文档 5、Doris&StarRocks支持自动建表从4.13版本开始，当客户构建数仓时使用Doris、StarRocks作为目标库时，由于Doris、StarRocks有多种表类型，大多需要手动建表，然后进行ETL配置，操作比较繁琐。在FDL4.1.3中，支持Doris、StarRocks的自动建表功能，同时可以定义表类型。支持的表类型有： ● Doris：明细模型（Duplicate Key）、主键模型（Unique Key） ● StarRocks：明细模型（Duplicate Key）、更新模型（Unique Key）、主键模型（Primary Key）另外，结合高级建表功能，用户可以修改建表语句，定义更灵活丰富的建表属性。 💠详情：配置管道任务-表字段映射- FineDataLink帮助文档数据同步功能说明- FineDataLink帮助文档 6、数据服务/数据管道支持Db2数据源在数据服务模块中，FineDataLink 支持将处理好的数据库中的数据通过 API 形式发布出去，供其他工具使用。从4.1.3版本开始，新增支持Db2数据源. 目前数据服务模块已支持： MySQL、SQL Server、Oracle、PostgreSQL、GreenPlum、FineBI公共数据、IBM DB2、Doris、TiDB、Impala、TRANSWARP INCEPTOR、StarRocks、GaussDB 200、阿里云Maxcomputer以上十四种数据源。在数据管道模块中，4.14版本新增支持Db2数据源，用户可以在管道任务中选取Db2数据源进行实时的数据同步。目前数据管道模块已支持： MySQL、SQLServer、Oracle、PostgreSQL、Kafka、GaussDB200、Greenplum、Doris、StarRocks、TiDB、ClickHouse、Amazon Redshift、SeaboxMPP、SAP HANA、IBM Db2以上十五种数据源。 💠详情： FineDataLink支持的数据源- FineDataLink帮助文档 IBM DB2环境准备- FineDataLink帮助文档二、数据开发 1、定时任务支持运行到此节点常见场景：当运行的多个节点处于整个流程的前半部分时，为了更新上游数据，便于调试，就可以使用「运行到此节点」。从4.1.4版本开始，在数据开发右键菜单中加入「运行到此节点」选项，在「任务运维」-「运行记录」-「任务记录」中加入「重试」选项。可以使任务从头运行到此并产生实例。定时任务运行至此节点 💠详情：运行至此节点- FineDataLink帮助文档 2、文件读取、输出优化为了支持更多种类的文件数据解析落库，以及确保从Finedatalink输出的文件支持从Finedatalink获取数据。在4.1.4版本对文件读取、输出进行了一系列的优化： ● 对齐文件输入输出配置，使文件输出配置选项和文件输入配置选项保持一致。 ● 开放上传的文件类型，不限制后缀名，本地/FTP/SFTP上的json/xml等文件也可以解析为二维表上传; ● 文件输出CSV数据时可以将CSV文件的后缀设置为txt\tsv\log等。同时，在文件输入CSV数据时也可以将后缀为txt\tsv\log的数据作为CSV文件输入。文件输入支持更多文件与后缀 💠详情：文件输入功能说明- FineDataLink帮助文档文件输出算子功能说明- FineDataLink帮助文档 3、支持直接选表同步数据的功能 4.1.3版本新增支持获取来源表的schema信息，现在在数据同步节点、「DB表输入算子」、「参数赋值」、数据服务的发布内容及参数中新增直接选表的配置方式，并支持配置过滤条件。可以选择从下拉框直接选表，不需要写入任何SQL代码。未来会基于此衍生出一系列的高级特性。例如支持同步DDL、多库多表同步。 DB表输入配置 💠详情：数据同步功能说明- FineDataLink帮助文档 4、利用并行取数提高读写效率(MySQL\Oracle\SQL Server) 4.1.3版本针对数据库的特性做一些性能优化。在数据同步、数据转换的输入、输出算子下，增加并行取数的配置项，利用并行取数提高了读写效率，耗时最大可以缩减约80%。并行取数配置 💠详情：数据同步功能说明- FineDataLink帮助文档 5、定时任务支持调用数据库存储过程（MySQL\Oracle\SQL Server) 4.1.3版本在定时任务支持调用数据库存储过程新增两种调用方式： ● SQL脚本新增了“存储过程”选择项,支持传入任务参数和动态参数。 ● 「数据同步」、「数据转换」、「参数赋值」新增了“存储过程”选择项，调用数据库存储过程支持选择返回的结果集。存储过程参数配置 💠详情：定时任务调用数据库存储过程- FineDataLink帮助文档三、任务运维 1、产品各模块内存资源和并发控制常见场景：有些公司ETL任务一般是夜晚进行，就需要为ETL任务在白天分配低内存，在夜晚分配高内存，从而实现资源的合理配置。新版本在负载管理功能下新增「负载分配」模块。支持将数据管道、数据开发和数据服务的内存资源拆分，可以独立控制。支持数据开发、数据管道的并发控制，可以灵活调整不同模块的任务并发数。负载管理配置 💠详情：负载分配- FineDataLink帮助文档 2、定时任务自定义调度日历常见场景：金融类外企/银行的工作日和节假日执行时间非正常工作日，定时任务的调度时间需要自定义。 ● 新版本在任务运维-调度计划中新增「调度日历配置项」，可以上传日历文件作为调度日历。 ● 在定时任务模块下的调度计划-定时调度中可以灵活设置任务调度所引用的日历并进行可视化预览。调度日历配置 💠详情：定时任务运维-调度计划- FineDataLink帮助文档 3、提供定时任务\数据管道\数据服务的批量操作常见场景：面对大量任务，手动开启任务或者调整调度计划需要耗费许多时间。新版本提供的批量操作功能可以优化用户使用体验。例如在定时任务中一键全选或者多选任务，执行批量设置容错机制、任务属性、结果通知操作。 ● 支持定时任务调度批量开启/关闭与设置任务控制（超时/重试/脏数据/任务优先级/结果通知） ● 支持管道任务批量启动\暂停 ● 支持API批量上下线批量处理管道任务 💠详情：定时任务运维-任务管理- FineDataLink帮助文档管道任务运维- FineDataLink帮助文档服务运维- FineDataLink帮助文档四、最佳实践合集在过去的一个月里，我们根据众多客户的使用场景，在原有数仓搭建、API取数专题、数据告警和业务场景的基础上进行了更新： 1、金蝶K3系统以起始行为参数接口取数当在金蝶K3 Cloud系统接口需要进行分页报表取数时，但没有有提供页码参数时，需要根据接口中返回的总行数，开始行索引参数以及返回行数限制参数进行取数。 2、API取数-钉钉获取部门用户信息钉钉作为企业的通讯平台，需要获取钉钉中的用户和所在部门数据进行分析，但接口每次只能获取当前部门的下一部门基础信息，并不能获取当前部门下所有层级子部门信息，方案提供了获取所有部门和用户信息的方法。 3、数仓搭建-数仓拉链表实践当需要获取一个事物从最开始到当前状态的所有变化信息时，一般采用拉链表用来存储当天最新数据以及之前的历史的数据，这样既能满足反应数据的历史状态，又能最大限度地节省存储空间，但拉链表的实践在远比普通表难度要高，此方案提供了数仓拉链表的实践。除此之外，还有一些其他场景：基于旺店通和手工Excel的电商场景销售分析、基于EAS、OA系统的财务收入核算场景等，欢迎大家直接登录Demo平台进行查看。 💠 产品更新详情： 4.1.3更新日志- FineDataLink帮助文档 4.1.4 更新日志- FineDataLink帮助文档点击此处，直接体验若有企业试用需求，请填写此申请表单，我们的工作人员会在3个工作日内联系您！

4335浏览

0回帖

FineDataLink

2024-1-15发布

提问

调整图片尺寸与位置

yzmXz2z20249308（uid：1060314）