文档章节

Canal & Otter 的一些注意事项和最佳实践

whaon
 whaon
发布于 2015/11/02 11:26
字数 924
阅读 14716
收藏 13

1,canal和otter由于是java开发的,运行在windows和linux上都可以

2,为了使用otter必须要canal的支持,otter作为canal的消费方,当然也可以单独使用canal,如果你有消费mysql binlog的需求

3,canal有几种运行方式,生产环境中推荐使用zookeeper的持久化方式,对应的spring配置文件为:default-instance.xml

4,运行otter需要aria2的支持,windows和linux都有对应的版本

centos5,安装aria2的解决办法:

wget http://packages.sw.be/rpmforge-release/rpmforge-release-0.5.2-2.el5.rf.x86_64.rpm
rpm -Uvh rpmforge-release-0.5.2-2.el5.rf.x86_64.rpm
yum -y install aria2

5,canal在otter中只支持嵌入的方式,通过管理界面配置就好,不需要再手动控制canal,canal是通过线程的方式运行在node节点

6,canal用的zookeeper和node-manager用的zookeeper可以用同一个,数据不会冲突,但是至少要3台机器做集群来HA,也可以利用zookeeper的observer特性构成读镜像来提升性能

7,otter只支持ROW模式的数据同步,其他两种模式不支持

8,源库只支持mysql,目标库支持mysql和oracle

9,同步的表必须要有主键,无主键表update会是一个全表扫描,效率比较差),就是全字段匹配,如果出现重复记录的话,同步会导致数据错乱

10,支持部分ddl同步  (支持create table / drop table / alter table / truncate table / rename table / create index / drop index,其他类型的暂不支持,比如grant,create user,trigger等等),同时ddl语句不支持幂等性操作,所以出现重复同步时,会导致同步挂起,可通过配置高级参数:跳过ddl异常,来解决这个问题.  

11,不支持带外键的记录同步.  (数据载入算法会打算事务,进行并行处理,会导致外键约束无法满足)

12,数据库上trigger配置慎重.  (比如源库,有一张A表配置了trigger,将A表上的变化记录到B表中,而B表也需要同步。如果目标库也有这trigger,在同步时会插入一次A表,2次B表,因为A表的同步插入也会触发trigger插入一次B表,所以有2次B表同步.)

13,2个manager,可以部署2个manager,manager之间本身没有通信,而是通过zk和数据库,配置node的时候需要知道manager,可以指定其中一个即可,数据会反应到数据库和zk中,但是当这个manager挂了,新配置的node信息就不能反馈到另外一个manager上,所以最佳实践是指定所有的manage

14,https的支持,otter用的是jetty,修改下jetty.xml,改成https的方式就好,同时要修改otter.properties中的otter.domainName参数,谁知道生成的菜单变成了类似https/auto_keeper_clusters_list.htm,由于菜单是公用的,找到navigation.vm,修改url链接就好了,然而在登录的时候又粗线问题了,后台验证成功后,跳转的url连接又不对,后来发现otter用的是webx的框架,找到了uris.xml,找到serverURI节点,把前面的http://去掉就可以了

15,禁止匿名访问,本来是想通过filter的方式来实现,但是发现session中怎么也取不到登录后的信息,发现webx框架自己实现了session,已经无解了,通过查看manager的配置文件发现了webx.xml这个好东西,发现urlAnalyze节点里配置了权限相关,愉快的解决了

需要的软件及脚本下载:

http://pan.baidu.com/s/1o6s14Ie



© 著作权归作者所有

共有 人打赏支持
whaon

whaon

粉丝 47
博文 42
码字总数 38353
作品 0
厦门
程序员
私信 提问
加载中

评论(11)

whaon
whaon

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢

引用来自“whaon”的评论

你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7

引用来自“fanch007”的评论

这个文档上讲的是原理,一些具体的配置,如NODE配置如何指向MANAGE的多节点,OTTER系统配置数据库的配置宕机之后的切换配置,可以分享下你的配置流程和过程中的经验吗?

引用来自“whaon”的评论

OTTER系统配置数据库的配置宕机之后的切换配置,这个你是指数据库的主备切换么,如果是的话我们目前没有这样配置,上面的连接里最下面有相关的说明,应该是可以的

引用来自“fanch007”的评论

被消费的数据库的切换我是懂的,只要在groupkey那边设置,我指的是OTTER这个数据库,存放了NODE,ZOKEEPER等这些配置信息的数据库的高可用
可以参考这篇文章:http://my.oschina.net/dxqr/blog/530928
fanch007
fanch007

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢

引用来自“whaon”的评论

你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7

引用来自“fanch007”的评论

这个文档上讲的是原理,一些具体的配置,如NODE配置如何指向MANAGE的多节点,OTTER系统配置数据库的配置宕机之后的切换配置,可以分享下你的配置流程和过程中的经验吗?

引用来自“whaon”的评论

OTTER系统配置数据库的配置宕机之后的切换配置,这个你是指数据库的主备切换么,如果是的话我们目前没有这样配置,上面的连接里最下面有相关的说明,应该是可以的
被消费的数据库的切换我是懂的,只要在groupkey那边设置,我指的是OTTER这个数据库,存放了NODE,ZOKEEPER等这些配置信息的数据库的高可用
whaon
whaon

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢

引用来自“whaon”的评论

你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7

引用来自“fanch007”的评论

这个文档上讲的是原理,一些具体的配置,如NODE配置如何指向MANAGE的多节点,OTTER系统配置数据库的配置宕机之后的切换配置,可以分享下你的配置流程和过程中的经验吗?
OTTER系统配置数据库的配置宕机之后的切换配置,这个你是指数据库的主备切换么,如果是的话我们目前没有这样配置,上面的连接里最下面有相关的说明,应该是可以的
whaon
whaon

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢

引用来自“whaon”的评论

你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7

引用来自“fanch007”的评论

这个文档上讲的是原理,一些具体的配置,如NODE配置如何指向MANAGE的多节点,OTTER系统配置数据库的配置宕机之后的切换配置,可以分享下你的配置流程和过程中的经验吗?
我们线上的暂时只配置了一个manager,如果指向manager多节点的话我之前尝试过otter.manager.address = 127.0.0.1:1099,这个配置以逗号分隔,应该是可以的,因为蛮久前了我也记不大清了,你可以自己尝试下
fanch007
fanch007

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢

引用来自“whaon”的评论

你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7
这个文档上讲的是原理,一些具体的配置,如NODE配置如何指向MANAGE的多节点,OTTER系统配置数据库的配置宕机之后的切换配置,可以分享下你的配置流程和过程中的经验吗?
whaon
whaon

引用来自“fanch007”的评论

你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢
你好,请参考https://github.com/alibaba/otter/wiki/Otter%E9%AB%98%E5%8F%AF%E7%94%A8%E6%80%A7
fanch007
fanch007
你好,请问OTTER系统中的高可用是如何配置的啊,比如:MANGAE管理的节点(NODE如何指向),OTTER自己的配置数据库,配置的CANAL节点,同步用的数据源(源头)等,求大神指导,谢谢
whaon
whaon

引用来自“qeeainburg”的评论

canal client可以多线程去拉server的数据吗?
不能多线程拉吧,但是拉回来的数据自己可以多线程处理
qeeainburg
qeeainburg
canal client可以多线程去拉server的数据吗?
whaon
whaon

引用来自“大叔在路上”的评论

你好,请教一下 " 会导致同步挂起,可通过配置高级参数:跳过ddl异常 " 这个是在mysql里面设置吗?
不是,是在manager的页面配置,你多点点相信你会找到的
【源码】otter工程结构

最近在搞数据同步相关的内容,需要对otter的代码进行扩展,所以需要先熟悉一下otter的源码。首先我们整体来看下otter的工程结构。otter的工程结构比较复杂,需要花费一定的时间来理解各个部分...

端木轩
2018/01/22
0
0
有没有人研究过Canal基于其它方式的配置

canal提供两种方式配置,spring和manager,spring是基于配置文件的,也是现在在百度上百度出来的几乎所有关于canal文章中描述的。但是,阿里自己并不是使用这种方式,spring只是为了开源而额...

尚浩宇
2017/03/16
105
0
Otter-入门篇1(阿里开源项目Otter介绍)

呜啦啦啦啦!今天笔者又来开坑了,这次开坑的对象呢是阿里的一个开源项目Otter,Otter它是一个数据同步解决方案,可以解决本地跨网络跨机房跨地域的数据同步问题,并且拥有可观的效率,web管理工具...

喵了_个咪
2016/07/27
7.1K
24
Mysql跨机房同步方案

假设现有两个机房,需要做到数据同步。 以下是架构图(实际架构图根据现有机房架构和实际会比下图复杂,但整体思路不变): Mycat、Canal、Otter是关键的三项技术: Mycat:数据库分库分表中...

尚浩宇
2016/05/19
1K
0
canal与hbase的protobuf版本冲突

测试环境:canal server和client版本:v1.0.22;hbase-client版本:1.0.1.1 报错原因:canal 1.0.22版本依赖的protobuf版本为2.4.1,hbase依赖的protobuf版本为2.5.0,存在冲突。canal客户端...

1010101010
2016/10/31
253
0

没有更多内容

加载失败,请刷新页面

加载更多

OSChina 周一乱弹 —— 白掌柜说了卖货不卖身

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @爱漫爱 :这是一场修行分享羽肿的单曲《Moony》 手机党少年们想听歌,请使劲儿戳(这里) @clouddyy :开不开心? 开心呀, 我又不爱睡懒觉…...

小小编辑
今天
8
0
大数据教程(11.7)hadoop2.9.1平台上仓库工具hive1.2.2搭建

上一篇文章介绍了hive2.3.4的搭建,然而这个版本已经不能稳定的支持mapreduce程序。本篇博主将分享hive1.2.2工具搭建全过程。先说明:本节就直接在上一节的hadoop环境中搭建了! 一、下载apa...

em_aaron
今天
3
0
开始看《JSP&Servlet学习笔记》

1:WEB应用简介。其中1.2.1对Web容器的工作流程写得不错 2:编写Servlet。搞清楚了Java的Web目录结构,以及Web.xml的一些配置作用。特别是讲了@WebServlet标签 3:请求与响应。更细致的讲了从...

max佩恩
今天
4
0
mysql分区功能详细介绍,以及实例

一,什么是数据库分区 前段时间写过一篇关于mysql分表的的文章,下面来说一下什么是数据库分区,以mysql为例。mysql数据库中的数据是以文件的形势存在磁盘上的,默认放在/mysql/data下面(可...

吴伟祥
今天
3
0
SQL语句查询

1.1 排序 通过order by语句,可以将查询出的结果进行排序。放置在select语句的最后。 格式: SELECT * FROM 表名 ORDER BY 排序字段ASC|DESC; ASC 升序 (默认) DESC 降序 1.查询所有商品信息,...

stars永恒
今天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部