文档章节

[转] Greenplum 备份和恢复数据库概览

Goopand
 Goopand
发布于 2015/03/31 14:15
字数 699
阅读 89
收藏 0

GP推荐你定期备份数据库。这些备份能够被用来恢复你的数据或在系统失败或数据丢失时重建gp数据库系统。你也能使用备份文件来做数据库迁移。

 

1.关于并行备份

GP并行备份工具:gp_dump

GP自动定期备份工具:gpcrondump (对gp_dump的封装)

备份过程:

因为Segments是并行导出,备份所花费的时间应该是按比例的,不管segment的数据如何。Master备份中包含了DDL语句和GP 系统字典表(如 gp_segment_configuration)。Segment备份中包含一个独立segment instance的数据。每个Segment Instance会创建一个dump文件。所有的dump文件组成了总备份集,它们是通过唯一14位timestamp key来识别。

Greenplum介绍-备份和恢复数据库概览

(并行备份数据库)

 

2.关于非并行备份

GP也支持常规的PostgreSQL的dump工具:pg_dump 和 pg_dumpall

----在Master上产生一个大dump文件包含所有segment数据,需要注意master磁盘空间。这个工具主要是用来从常规PostgresQL到GP的数据迁移

另外一个有用的导出数据命令: COPY TO

----允许以文本方式导出全部或部分表数据,在master上

 如果在2个不同segment配置(如:Instance不一样)情况下,GP推荐使用gp_dump和gpcrondump。


3.关于并行恢复

GP并行恢复工具:gp_restore 和 gpdbrestore (对gp_restore封装,和gpcrondump相对应)

该工具通过 timestamp key来校验备份数据集并且恢复数据库对象和数据。数据恢复也是并行的。

Greenplum介绍-备份和恢复数据库概览

(并行数据恢复)

 

4.关于非并行恢复

GP也支持常规的PostgreSQL的恢复工具: pg_restore (与pg_dump、pg_dumpall对应)

注意,在把PostgreSQL dump文件恢复至GP库时,确定dump文件中的CREATE TABLE 是否有加DISTRIBUTED。

 

有时候我们会遇到这种情况,从一个并行备份数据集中做非并行数据恢复。例如,假如要做数据迁移,从4个segments上的迁至5个segments的GP库中。你不能使用并行恢复数据,因为你的备份数据集仅仅只有4个备份文件并且在新系统中数据分布不平衡。一个非并行恢复工具来恢复并行导出数据,拷贝他们至master并且通过master将数据载入到每个segment中。

 Greenplum介绍-备份和恢复数据库概览

                                (非并行恢复数据库)



注意事项:

如果恢复的系统与备份的系统具有相同数量的Instance,使用gp_restore或gpdbrestore命令来恢复。

如果是在不同集群迁移间迁移,必须使用非并行恢复。参见《Greenplum4.2.2管理员指南-20130603》”恢复到配置不同的GPDB系统” 一节。



本文转载自:http://blog.sina.com.cn/s/blog_90474a9201018gls.html

共有 人打赏支持
Goopand
粉丝 12
博文 436
码字总数 236906
作品 0
朝阳
私信 提问
Greenplum 的一次紧急恢复

[TOC] 概述 客户的GP节点磁盘遭遇损坏,导致数据丢失。gprecoverseg命令无法恢复节点后做的一次非常规Greenplum恢复操作。 使用背景 在某次紧急运维下,我发现用户GP的某一个primary节点的状...

高木易
03/19
0
0
Greenplum中备份和恢复数据

备份与恢复 备份恢复操作概述 关于并行备份(gp_dump) 1) GP同时备份Master和所有活动的Segment实例 2) 备份消耗的时间与系统中实例的数量没有关系 3) 在Master主机上备份所有DDL文件和GP相关...

fortyone41
2016/07/25
0
0
Greenplum:你不可不知的实施与维护最佳实践

近两年,国内的大数据市场逐渐成熟,有真实的大数据处理需求的企业数量呈现爆炸性的增长,从传统的数据库产品往MPP数据库转型的增长势头十分迅猛。Greenplum作为MPP产品的领头羊,具有较低的...

陈彰
2016/02/23
0
0
数据库案例集锦 - 开发者的《如来神掌》

标签 PostgreSQL , PG DBA cookbook , PG Oracle兼容性 , PG 架构师 cookbook , PG 开发者 cookbook , PG 应用案例 背景 「剑魔独孤求败,纵横江湖三十馀载,杀尽仇寇,败尽英雄,天下更无抗...

德哥
2017/06/09
0
0
Greenplum 逻辑备份增强 - 备份期间不锁metadata(pg_class),不堵塞DDL

标签 PostgreSQL , 逻辑备份 , 一致性 , 堵塞DDL , 锁元数据 背景 逻辑备份为了保障库级别的全局一致性,使用了MVCC的机制来保障。 需要锁元数据(catalog AccessShareLock)(同时对备份对象加...

德哥
2018/10/05
0
0

没有更多内容

加载失败,请刷新页面

加载更多

第11章 多线程

程序、进程、线程 程序(program)是为完成特定任务、用某种语言编写的一组指令的集合。即指一段静态的代码,静态对象。 **进程(process)**是程序的一次执行过程或是正在运行的一个程序。动...

流小文
11分钟前
0
0
SpringBoot引入第三方jar包或本地jar包的处理方式

在开发过程中有时会用到maven仓库里没有的jar包或者本地的jar包,这时没办法通过pom直接引入,那么该怎么解决呢 一般有两种方法 - 第一种是将本地jar包安装在本地maven库 - 第二种是将本地j...

独钓渔
今天
2
0
五、MyBatis缓存

一、MyBatis缓存介绍 缓存的使用可以明显的加快访问数据速度,提升程序处理性能,生活和工作中,使用缓存的地方很多。在开发过程中,从前端-->后端-->数据库等都涉及到缓存。MyBatis作为数据...

yangjianzhou
今天
2
0
最近研究如何加速UI界面开发,有点感觉了

最近在开发JFinal学院的JBolt开发平台,后端没啥说的,做各种极简使用的封装,开发者上手直接使用。 JBolt开发平台包含常用的用户、角色、权限、字典、全局配置、缓存、增删改查完整模块、电...

山东-小木
今天
3
0
《月亮与六便士》的读后感作文3000字

《月亮与六便士》的读后感作文3000字: 看完英国作家威廉.萨默塞特.毛姆所著《月亮与六便士》(李继宏译),第一疑问就是全书即没提到“月亮”,也没提到“六便士”。那这书名又与内容有什么...

原创小博客
昨天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部