Canal & Otter 的一些注意事项和最佳实践

原创
2015/11/02 11:26
阅读数 5.1W

1,canal和otter由于是java开发的,运行在windows和linux上都可以

2,为了使用otter必须要canal的支持,otter作为canal的消费方,当然也可以单独使用canal,如果你有消费mysql binlog的需求

3,canal有几种运行方式,生产环境中推荐使用zookeeper的持久化方式,对应的spring配置文件为:default-instance.xml

4,运行otter需要aria2的支持,windows和linux都有对应的版本

centos5,安装aria2的解决办法:

wget http://packages.sw.be/rpmforge-release/rpmforge-release-0.5.2-2.el5.rf.x86_64.rpm
rpm -Uvh rpmforge-release-0.5.2-2.el5.rf.x86_64.rpm
yum -y install aria2

5,canal在otter中只支持嵌入的方式,通过管理界面配置就好,不需要再手动控制canal,canal是通过线程的方式运行在node节点

6,canal用的zookeeper和node-manager用的zookeeper可以用同一个,数据不会冲突,但是至少要3台机器做集群来HA,也可以利用zookeeper的observer特性构成读镜像来提升性能

7,otter只支持ROW模式的数据同步,其他两种模式不支持

8,源库只支持mysql,目标库支持mysql和oracle

9,同步的表必须要有主键,无主键表update会是一个全表扫描,效率比较差),就是全字段匹配,如果出现重复记录的话,同步会导致数据错乱

10,支持部分ddl同步  (支持create table / drop table / alter table / truncate table / rename table / create index / drop index,其他类型的暂不支持,比如grant,create user,trigger等等),同时ddl语句不支持幂等性操作,所以出现重复同步时,会导致同步挂起,可通过配置高级参数:跳过ddl异常,来解决这个问题.  

11,不支持带外键的记录同步.  (数据载入算法会打算事务,进行并行处理,会导致外键约束无法满足)

12,数据库上trigger配置慎重.  (比如源库,有一张A表配置了trigger,将A表上的变化记录到B表中,而B表也需要同步。如果目标库也有这trigger,在同步时会插入一次A表,2次B表,因为A表的同步插入也会触发trigger插入一次B表,所以有2次B表同步.)

13,2个manager,可以部署2个manager,manager之间本身没有通信,而是通过zk和数据库,配置node的时候需要知道manager,可以指定其中一个即可,数据会反应到数据库和zk中,但是当这个manager挂了,新配置的node信息就不能反馈到另外一个manager上,所以最佳实践是指定所有的manage

14,https的支持,otter用的是jetty,修改下jetty.xml,改成https的方式就好,同时要修改otter.properties中的otter.domainName参数,谁知道生成的菜单变成了类似https/auto_keeper_clusters_list.htm,由于菜单是公用的,找到navigation.vm,修改url链接就好了,然而在登录的时候又粗线问题了,后台验证成功后,跳转的url连接又不对,后来发现otter用的是webx的框架,找到了uris.xml,找到serverURI节点,把前面的http://去掉就可以了

15,禁止匿名访问,本来是想通过filter的方式来实现,但是发现session中怎么也取不到登录后的信息,发现webx框架自己实现了session,已经无解了,通过查看manager的配置文件发现了webx.xml这个好东西,发现urlAnalyze节点里配置了权限相关,愉快的解决了

需要的软件及脚本下载:

http://pan.baidu.com/s/1o6s14Ie



展开阅读全文
打赏
2
14 收藏
分享
加载中
whaon博主

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢

引用来自“whaon”的评论

你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7

引用来自“fanch007”的评论

这个文档上讲的是原理,一些具体的配置,如NODE配置如何指向MANAGE的多节点,OTTER系统配置数据库的配置宕机之后的切换配置,可以分享下你的配置流程和过程中的经验吗?

引用来自“whaon”的评论

OTTER系统配置数据库的配置宕机之后的切换配置,这个你是指数据库的主备切换么,如果是的话我们目前没有这样配置,上面的连接里最下面有相关的说明,应该是可以的

引用来自“fanch007”的评论

被消费的数据库的切换我是懂的,只要在groupkey那边设置,我指的是OTTER这个数据库,存放了NODE,ZOKEEPER等这些配置信息的数据库的高可用
可以参考这篇文章:http://my.oschina.net/dxqr/blog/530928
2016/05/03 11:11
回复
举报

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢

引用来自“whaon”的评论

你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7

引用来自“fanch007”的评论

这个文档上讲的是原理,一些具体的配置,如NODE配置如何指向MANAGE的多节点,OTTER系统配置数据库的配置宕机之后的切换配置,可以分享下你的配置流程和过程中的经验吗?

引用来自“whaon”的评论

OTTER系统配置数据库的配置宕机之后的切换配置,这个你是指数据库的主备切换么,如果是的话我们目前没有这样配置,上面的连接里最下面有相关的说明,应该是可以的
被消费的数据库的切换我是懂的,只要在groupkey那边设置,我指的是OTTER这个数据库,存放了NODE,ZOKEEPER等这些配置信息的数据库的高可用
2016/05/03 11:07
回复
举报
whaon博主

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢

引用来自“whaon”的评论

你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7

引用来自“fanch007”的评论

这个文档上讲的是原理,一些具体的配置,如NODE配置如何指向MANAGE的多节点,OTTER系统配置数据库的配置宕机之后的切换配置,可以分享下你的配置流程和过程中的经验吗?
OTTER系统配置数据库的配置宕机之后的切换配置,这个你是指数据库的主备切换么,如果是的话我们目前没有这样配置,上面的连接里最下面有相关的说明,应该是可以的
2016/05/03 10:59
回复
举报
whaon博主

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢

引用来自“whaon”的评论

你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7

引用来自“fanch007”的评论

这个文档上讲的是原理,一些具体的配置,如NODE配置如何指向MANAGE的多节点,OTTER系统配置数据库的配置宕机之后的切换配置,可以分享下你的配置流程和过程中的经验吗?
我们线上的暂时只配置了一个manager,如果指向manager多节点的话我之前尝试过otter.manager.address = 127.0.0.1:1099,这个配置以逗号分隔,应该是可以的,因为蛮久前了我也记不大清了,你可以自己尝试下
2016/05/03 10:57
回复
举报

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢

引用来自“whaon”的评论

你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7
这个文档上讲的是原理,一些具体的配置,如NODE配置如何指向MANAGE的多节点,OTTER系统配置数据库的配置宕机之后的切换配置,可以分享下你的配置流程和过程中的经验吗?
2016/05/03 10:30
回复
举报
whaon博主

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢
你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7
2016/05/03 09:23
回复
举报
你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢
2016/05/02 17:01
回复
举报
whaon博主

引用来自“qeeainburg”的评论

canal client可以多线程去拉server的数据吗?
不能多线程拉吧,但是拉回来的数据自己可以多线程处理
2016/04/14 18:12
回复
举报
canal client可以多线程去拉server的数据吗?
2016/04/14 16:26
回复
举报
whaon博主

引用来自“大叔在路上”的评论

你好,请教一下 " 会导致同步挂起,可通过配置高级参数:跳过ddl异常 " 这个是在mysql里面设置吗?
不是,是在manager的页面配置,你多点点相信你会找到的
2016/03/29 20:31
回复
举报
更多评论
打赏
11 评论
14 收藏
2
分享
返回顶部
顶部