FineDataLink文档月刊【2023年12月】

知识库

FineDataLink 产品月报汇集了每月的产品更新、客户案例以及文档活动，通过产品月报，您可以快速学习本月的新知识、新内容！

1、产品新功能

新增分组汇总算子

新增「分组汇总」算子，对原始数据根据条件将相同的数据先合并到一组，然后按照分组后的数据进行汇总计算。如下图所示：

Ø 详情请参见：分组汇总算子

新增字段拆行、字段拆列算子

用户可用可视化的配置方式实现按分隔符对数据的行列拆分，避免写大量 SQL ，提升数据处理效率。

1）新增「字段拆行」算子，字段值按照特定规则（分隔符）拆分，拆分后的结果形成新的一列字段和值。如下图所示：

Ø 详情请参见：字段拆行

2）新增「字段拆列」算子，字段值按照特定规则（分隔符或字符数）拆分，拆分后的结果形成新的多列字段和值。如下图所示：

Ø 详情请参见：字段拆列

定时任务支持调用数据库存储过程

数据源是 MySQL、Oracle、SQLServer ，定时任务的SQL脚本、数据同步、数据转换>DB表输入、参数赋值中支持调用数据库存储过程。如下图所示：

Ø 详情请参见：定时任务调用数据库存储过程

读取、创建、写入分区表

详情请参见：读取、创建、写入分区表

1）数据写入Hive、星环 TRANSWARP INCEPTOR数据库时，支持创建、写入分区表。如下图所示：

2）支持读取 PostgreSQL 数据库的分区表。

定时任务支持直接选表功能&并发读取功能

「数据源」中选择DB表输入类型时，支持直接选表功能，用户可在下拉框中选择某张数据库表读取数据，且能为这张表添加过滤条件。

使用直接选表功能，才可开启并发读取功能。在数据量很大时，开启「并行取数」，可提高读取数据的速度。

如下图所示：

Ø 详情请参见：数据同步功能说明

将BI公共数据作为数据连接

FineBI 和 FineDataLink 中支持新建「远程公共数据」数据连接。

配置需要远程访问的 FineBI 工程后，可在 FineDataLink 定时任务「数据同步」「参数赋值」「DB表输入」、数据服务（仅支持独立部署环境下）中作为数据源读取数据使用。如下图所示：

Ø 详情请参见：配置远程公共数据源

提供通用JDBC对接取数和执行SQL的能力

当用户想要使用FineDataLink支持的数据源以外的其他的 JDBC 类型数据库作为 FineDataLink 中的定时任务数据源进行SQL 取数和执行 SQL等操作，可以使用该插件。

Ø 详情请参见：通用JDBC取数插件

API输入自带分页取数功能

需要使用 FineDataLink 取出 API 数据时，由于数据量限制或者接口响应时间，有时需要分页取数。FineDataLink 提供了 API 分页功能。如下图所示：

Ø 详情请参见：API输入-分页取数

数据服务支持更多数据源

数据服务API支持发布Starrocks、GaussDB、MaxCompute数据源。

Doris、StarRocks 作为写入端，支持自动建表

管道任务&定时任务中，Doris、StarRocks 数据源作为写入端，支持自动建表。如下图所示：

Ø 详情请参见：配置管道任务-表字段映射、数据同步功能说明

2、最佳实践

以起始行数作为参数的API接口取数

应用场景：

从金蝶 k3Cloud 系统接口进行分页报表取数时，接口中没有提供页码参数，因此不能使用API取数-按页数取数方案。

但是接口中会返回所取数据的总行数，且接口请求参数中有开始行索引参数（从哪一行开始取数）、返回行数限制参数。

参考文档：

Ø 详情请参见：API取数-以起始行数作为参数

API取数-钉钉获取部门用户信息

应用场景：

用户想要同步钉钉通信录中的用户信息。

API取数-获取部门通讯录数据 中获取钉钉用户信息的方案，只适用于部门下用户数量不超过 100 的场景；若某部门中用户数超过 100，可参考本文方案获取用户信息。

参考文档：

Ø 详情请参见：方案二

数仓拉链表（来源表数据大于10000）

应用场景：

数仓拉链表 文档中提供的方案，使用「参数赋值」节点将来源表中的 ID 字段输出为参数，但「参数赋值」节点要求输出的参数不能超过 10000 个，若来源表数据超过 10000 条，该方案将不适用。

本文提供数据量较大场景（来源表数据超过 10000）下拉链表的实现方案。

参考文档：

Ø 详情请参见：数仓拉链表（来源表数据大于10000）

0回帖数	1关注人数	4342浏览人数
最后回复于：2024-6-7 14:38

提问

FineDataLink文档月刊【2023年12月】

1、产品新功能

新增分组汇总算子

新增字段拆行、字段拆列算子

定时任务支持调用数据库存储过程

读取、创建、写入分区表

定时任务支持直接选表功能&并发读取功能

将BI公共数据作为数据连接

提供通用JDBC对接取数和执行SQL的能力

API输入自带分页取数功能

数据服务支持更多数据源

Doris、StarRocks 作为写入端，支持自动建表

更多功能

更多更新功能请参见：4.1.3更新日志、4.1.2更新日志

2、最佳实践

以起始行数作为参数的API接口取数

API取数-钉钉获取部门用户信息

数仓拉链表（来源表数据大于10000）