Kettle:Oracle多表格批量同步数据=》mysql

发布时间:2020-08-08 10:39:43 作者:newknight
来源:ITPUB博客 阅读:420

Oracle 多表格批量同步数据=》MYSQL

场景

多张Oracle表格,通过轮询自动同步数据到mysql。

避免每个Oracle表格数据=》mysql都做一个转换,产生大量转换,难以管理和调整。


主要通过kettle变量,循环,字段名自动匹配,以及Oracle、mysql数据字典来实现。

初步完成Oracle表格=》mysql的初始化同步,后续增加增量同步,DDL同步,异常处理操作。



基本步骤

1. 在mysql里查找test库下有哪些表格,输出到结果记录

2. 从结果记录里面每次取一行,设置变量

3. 针对每次使用的变量值,去oracle数据源里生成对应的表输入(通过变量生成)

4. 把变量赋给表输出组件的表名

5. 表输出其他内容不做制定,因为表名和字段都和源端oracle是一样的

6. 针对每个“输出到结果记录”做循环,插入每个oracle表格数据到mysql

 

总体流程

Kettle:Oracle多表格批量同步数据=》mysql

步骤1:Tables in mysql(Job)

Kettle:Oracle多表格批量同步数据=》mysql

步骤2:insert into mysql(Job)

Kettle:Oracle多表格批量同步数据=》mysql

步骤2.1 set tablename(tranfomation)

Kettle:Oracle多表格批量同步数据=》mysql

步骤2.2:insert data into mysql(tranfomation)

  Kettle:Oracle多表格批量同步数据=》mysql

后续问题:

l    如何做增量的数据迁移

1.        针对oracle这端有时间字段的表格

2.        记录每次迁移的系统时间

3.        增量时间是》上次系统时间 and 《本次系统时间

每张表格时间字段名字可能不一样

所以要维护一张表格时间字段记录(表名,时间字段名)

4.        每次生成表输入时,也参照生成表名变量的方式,获取时间字段名,用在表输入的sql里

5.        表输出这端,会复杂一些,包括删除、插入、更新等等操作

l    无时间字段或流水号的表格同步

l   如何做DDL同步:

1.       获取Oracle和mysql的数据字典

2.       比较表名和字段名

3.       比较字段数据类型

4.       注意数据类型映射(如oracle的varchar2《=》MySQL的varchar,oracle的data《=》MySQL的timestamp)

5.       Mysql端的表格和字段同步


推荐阅读:
  1. Kettle+MongoDB 数据同步到MySQL
  2. mysql数据不同步

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

kettle oracle mysql

上一篇:谈谈以太坊中的DOS攻击

下一篇:HP-UX之MP管理

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》