1. 简介
1.1 案例简介
通过此案例,可以实现数据工厂的全连接。全连接就是返回左右表中所有的记录和左右表中连接字段相等的记录。
假设 A 表有 4 条数据,B 表有 3 条数据,其中有 2 条数据两张表都有,那么全连接后,一共将有 5 条数据。
1.2 应用场景
目前数据工厂的横向连接,只有左连接,右连接,和内连接(取交集),如果需要取两表的并集的话,就是全连接,目前无法直接设置。
1.3 设计思路
1)通过追加合并,将所有需要全连接的表单的连接字段汇总到一张表单;
2)通过分组汇总,将连接字段进行去重处理,作为所有表单全连接的基础表;
3)通过横向连接,依次将其他表单连接到这张基础表单上;
4)通过字段设置,去除不必要的字段,调整表单结构。全连接即可完成。
1.4 预期效果
如下图,想要将人员入住登记与退住登记合为一张表,即可使用全连接的方式进行合并。
2. 设置步骤
在学习之前,您需要对简道云 数据工厂 功能有一定的基础了解。
点击安装 数据工厂全连接 应用模板(安装时请保留示例数据),本文以房屋入住/退住场景为例,带您了解如何实现数据工厂的全连接。
2.1 表单设计
安装模板后,在模板中已经设计好了 2 张表单。入住登记表和推主登记表。如下图所示:
两张表单的具体字段内容如下,记录了入住者的姓名以及入住和退住时间与状态:
2.2 录入数据
在 2 张表单中,已经分别为您录入了几条基础数据,您也可以重新添加数据进行学习:
如果我们想实现全连接,那么最终的数据结果应该如下:
2.3 数据工厂设置
在「管理后台>>数据工厂」新建一个数据流。如下图所示:
2.3.1 选择输入源
然后对数据流进行重命名,并点击「输入」节点,选择「入住登记」表作为数据源。如下图所示:
2.3.2 再次添加输入源
再添加一个「输入」节点,输入数据源选择退住登记表,字段选择「姓名、退住时间、退住状态」这几个字段。然后将退住登记和入住登记进行「追加合并」,并将字段删除到只保留「姓名字段」,如下图所示:
2.3.3 分组汇总
继续进行「分组汇总」处理,这一目的是为了将两表数据进行去重处理。汇总方式选择「计数」和「去重计数」均可:
2.3.4 横向连接
将入住登记与分组汇总后的的表单进行横向连接,连接时先连分组汇总表,再输入源入住登记表。连接后,连接方式设置为左连接,这一步 ,分组汇总为哪一侧表单,就选择什么连接方式。下图为左侧表单,则选择左连接。
然后连接字段选择姓名字段,注意,两张表的姓名字段均选择有「文本」标识的字段:
2.3.5 横向连接
先连上一步横向连接后的表,再连退住登记表。这一步 ,横向连接这个表为哪一侧表单,就选择什么连接方式,下图为左侧表单,则选择左连接。
然后连接字段选择姓名字段,注意,两张表的姓名字段均选择有「文本」标识的字段:
2.3.6 字段设置
继续添加一个字段设置节点,这一步,为的是将多余的字段进行去除。如下图所示,将分组汇总这一步带来的多余的姓名字段进行隐藏:
2.3.7 重命名&保存
最后,将字段设置节点连接到输出节点,并对输出节点重命名,然后保存,即可完成数据工厂全连接的设置。
2.4 效果演示
点击输出节点,即可看到全连接后的数据效果(预览时至展示部分数据),如下图所示:
如果数据量较大时,预览时可能看不到全部效果,可以使用仪表盘 明细表 进行展示。
|