kettle的不完全使用

楼主
我是社区第156926位番薯,欢迎点我头像关注我哦~
最近在做一个新的东西需求如下:

现有4个实时指标数据,来自不同的数据源,每个数据源的表结构相同,表名后缀都是根据appid来动态变化,需要借助kettle的处理进行数据的整合,形成结果表。
表名我们用A_${appid}代替appid是变量。然后现在开始我的操作:

一:项目实现的步骤


1.在本地上的运行和调度:因为是4个动态表,于是需要用到JS循环,根据参数appid的个数来循环遍历,需要18次,才能把需要的数据跑到结果集里

最后的job流程图如下:转换是为了把appid先存进去结果集,转换2是为了把表的数据输出到结果集,js是为了循环遍历

这样的步骤网上也有类似的参考文档,本人太懒,就不贴了哈哈哈

1.数据库是在阿里云上的,本地有限制,无法访问,所以只能放在服务器上部署访问,于是把kettle部署到服务器上

参考文档:https://jingyan.baidu.com/article/60ccbcebb60f1664cab19707.html
(服务器部署,但是不需要打开图形化界面,只要能运行作业和转换就行)

2.部署好了之后,在本地做好自己的准备工作,任务和转换都放在本地做好,调通,可以用测试数据跑起来,运行无误的时候,切换为生产库然后上传到服务器上,再用脚本执行任务或者转换即可

参考文档:https://www.cnblogs.com/kxm87/p/9493121.html

3.因为我的需求是要跑实时数据,也就是一分钟要执行一次job,还需要写定时脚本任务

参考文档:https://blog.csdn.net/zh_alen/article/details/52934719

这样就可以成功了,但是运行的过程也出现了一系列问题,因为自己并不是很懂这个工具,所以分享出来,人多力量大,总有可以帮我答疑解惑的大侠。



二、遇到的问题:

本地运行无任何问题,测试服务器上也未发现异常,放到正式服务器上初期也是可以执行成功的,每分钟都会跑任务,但是总在某个不经意的时刻上会出现卡顿现任务就会卡住,因为每次出现卡的地方不一样,很难定位,所以在排查问题的路上遇到很多阻碍,现在依旧是迷惑ing

卡顿如上图,停到这里无法执行下去。
提示一点和网络还有数据库的性能无关系,因为我已经排查了这两点,其他还会是什么问题会造成出现这种情况呢?

分享扩散:
参与人数 +1 F豆 +500 理由
传说哥 + 500 感谢分享

查看全部评分

沙发
发表于 2019-8-20 11:43:10
板凳
发表于 2019-8-20 15:12:19
地板
发表于 2019-8-20 19:22:44
10秒执行一次,间隔没对?
编辑于 2019-8-20 19:28  
5楼
发表于 2019-8-21 10:16:36
kettle适合做实时应用吗?
6楼
发表于 2019-8-21 14:14:15
6666666666666666666
7楼
发表于 2023-7-13 11:44:43
你好,看了你的笔记,感觉你学的很深入,作为初学者,对我来说太难了。我这边有个问题请教下,kettle连接mysql5.6数据库一直不行。还请看看。
报下面问题org.pentaho.di.core.exception.KettleDatabaseException:
Error occurred while trying to connect to the database

Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
org.gjt.mm.mysql.Driver
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表