Canal Instance 设计理念与定制开发思路是什么

发布时间:2021-10-21 15:19:45 作者:柒染
来源:亿速云 阅读:192

这篇文章将为大家详细讲解有关Canal Instance 设计理念与定制开发思路是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

Instance 是 Canal 数据同步的核心,在一个 Canal 实例中只有启动 Instace,才能实现数据的同步,那 Instance 到底是“何许人也”,以源码为手段,试图揭开 Instance 的神秘面纱。

 

1、Canal Instance 类继承体系


Canal Instance 设计理念与定制开发思路是什么  
重要的类说明如下:  
 

2、CanalInstance 四大核心组件


从类层次了解 Canal Instance 显得不那么直观,接下来先抛出一个使用场景,再结合架构图进一步加深对 Canal Instance 的理解。

例如某公司的订单系统使用了分库分表,数据库的分别部署在 192.168.1.166:3306,192.168.1.168:3306 两个数据库,并且每一个数据库上会创建多个 schema,例如 order_db、user_db,那现在为了对订单提供多维度的查询,统计等功能,架构组因此提出通过订阅数据库 binlog 日志,将两个订单库中的订单数据,即将 order_db 中的数据同步到 elasticsearch,而 Canal 的设计初衷就是为了解决上述问题,故我们可以边思考这个场景,来反推一下 Canal Instance 的设计理念。

Canal Instance 的架构图如下图所示:

Canal Instance 设计理念与定制开发思路是什么  
Canal 中数据的同步是由 CanalInstance 组件负责,一个 Canal Server 实例中可以创建多个 CanalInstance 实例。
 

每一个 CanalInstance 可以看成是对应一个 MySQL 实例,即案例中需要同步两个数据库实例,故最终需要创建两个 CanalInstance。其实也不难理解,因为 MySQL 的 binlog 就是以实例为维度进行存储的。Canal Instance 包含了 4个 核心组件 :EventParse、EventSink、EventStore、CanaMetaManager,在这里主要是阐明其作用,后续文章会一一详细介绍,以便更好的指导实践。

从最新的版本来看,Canal 支持直接将解析后的数据发送到MQ,故 CanalInstance 中还持有另外一个组件:CanalMQConfig,关于 MQ 的一些配置,提供了多种策略实现 shcema、table 到 MQ Topic 的自动映射管理,为 Canal 的使用者带来更多便利,这部分内容会在后续文章中单独介绍,这里先暂时不过多讨论。

经过上面的了解,我想大家对 Canal Instance 有了一个相对全面的了解了吧,接下来我们再来关注一下 CanalInstance 的构造方式,这个对后续的实践有着非常重要的影响。

 

3、CanalInstance 构造方式


Canal 中提供了两种方式对 Instance 进行初始化:Spring 与 手动编程方式。CanalInstance 最最核心的就是上述提到的4个组件,即 CanalInstanceWithManager 类的具体职责就是管理上述核心组件,即提供对上述组件的加载、启动、停止,并协调,从其名字就能看出来,从其构造函数同样能得知:

Canal Instance 设计理念与定制开发思路是什么  
编程方式创建 Canal Instance 比较简单,只需设置参数,并创建 CanalInstanceWithManger 方法即可,正如示例代码中使用的那样。  
Canal Instance 设计理念与定制开发思路是什么  
另外 Canal 提供了对 Spring 的整合,将 canal Instance 的相关核心组件纳入 Spring 的管理,其实现类为: CanalInstanceWithSpring,对应的 Spring 配置示例如下图所示:  

Canal Instance 设计理念与定制开发思路是什么

温馨提示:基于 Canal 二次开发的编程技巧思考如下:Canal 框架本身将 Canal Server 做成了启动脚本,可以通过自定义 Instance,即从 instance 配置文件中加载配置,然后启动 Canal Server 解析 Binlog 日志,最终按照预定的配置进行工作,例如在生产环境搭建一些 Canal 集群,统一交由运维去手动维护,如果需要数据同步,则配置相应的 instance 文件,然后进行启动就生效,其实这种模式处于 Canal 的初阶阶段,更好的方式是对 Canal 进行二次开发,通过可视化的界面,通过界面的方式定义数据同步任务,例如将指定数据库实例上的指定 Schema 的 binglog 日志同步到指定消息集群的指定 topic,并且可重推、随时停止,重启,这样 Canal 的维护者无需关注底层的细节,只需要通过页面简单配置一下即可。

源码 Canal 系列的第一篇文章后有好几个粉丝表示目前也在研究 Canal,由于笔者目前只能尽量保持周更,如果大家希望加快研究 Canal 的步伐,笔者有如下建议:

1、深入研究其四大核心组件,并带着问题去研究,例如在学习元数据管理时是如何保证数据不丢失,重启后又是如何定位位点的。

2、如果大家想更全局的去研究 Canal,我觉得除了阅读 Canal 官方的设计手册,还可以专门去看一下 CanalParameter 这个类,Canal 支持的所有配置属性,并且都有相应的注释,关于 Canal 的所有一切,都可以从这里窥探出端倪,然后可以选择感兴趣的内容加以继续深入学习。

关于Canal Instance 设计理念与定制开发思路是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

推荐阅读:
  1. 基于Docker结合Canal如何实现MySQL实时增量数据传输功能
  2. MySQL的binlog日志工具分析Canal的使用方法

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

canal instance

上一篇:linux中find和whereis命令怎么用

下一篇:Ubuntu磁盘管理命令有哪些

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》