Source of 1.Oracle数据泵介绍

  [TOC]

## 1. Oracle 数据泵介绍

Oracle数据泵是用来替换原始的export和import工具(exp,imp)

它从Oracle 10g开始提供

它可以快速和高效的将数据从一个数据库移动到另一个数据库

对于单线程数据泵导出性能比原始的快大约两倍，导入性能比原始的快15到40倍，配合并行度会得到更大幅度的提升

数据泵的信息记录在一张master table中,对于被用来处理大对象的工作，如果有大量小的对象则可能会变慢

可以使用compression参数压缩dump文件，但是需要高级压缩组件

##2. 数据泵的新概念

数据泵相对于原始的exp/imp有2个新的概念

### 2.1 目录对象(Directory Objects)

不同于原始的exp/imp工具，数据泵在服务器端使用服务器进程的一个Job，服务器进程使用Directory Objects来定位文件位置

DBA可以对目录设定权限

###2.2 交互式命令行模式(Interactive Command-Line Mode)

我们可以使用它来监控和控制数据泵的进程

这个下期介绍

##3. 使用数据泵

###3.1 创建目录
```
1. SQL> CREATE DIRECTORY dpump_dir1 AS ‘/usr/apps/datafiles’;
```

###3.2 跟用户赋予目录权限
```
2. SQL> GRANT READ,WRITE ON DIRECTORY dpump_dir1 TO
scott;
```
注意这里只是数据库层面的赋予scoot用户dpump_dir1读写的权限

操作系统层面我们需要数据库软件用户对该目录有权限

###3.3 导出数据库

在操作系统提示符下运行
```
3. >expdp username/password DIRECTORY=dpump_dir1 
dumpfile=scott.dmp
```


##4. 和exp/imp的一些对比

###4.1 import不同用户

注意这里remap_schema代替了fromuser/touser

**imp:**
```
> imp username/password FILE=scott.dmp FROMUSER=scott TOUSER=jim TABLES=(*)
```

**impdp:**
```
> impdp username/password DIRECTORY=dpump_dir1 DUMPFILE=scott.dmp
TABLES=scott.emp REMAP_SCHEMA=scott:jim
```

###4.2 INCLUDE和EXCLUDE

数据泵提供更加方便的过滤功能，我们可以使用include和exlude来控制导出的内容

注意inlcude和exclude不能同时使用


```
> exp username/password FULL=y FILE=dba.dmp GRANTS=y INDEXES=y ROWS=y
> 
> expdp username/password FULL=y INCLUDE=GRANT INCLUDE= INDEX
DIRECTORY=dpump_dir1 DUMPFILE=dba.dmp CONTENT=ALL
```

##5. 数据泵性能调优

不像原始的imp/exp工具有很多参数用来调优(BUFFER, COMMIT, COMPRESS,
CONSISTENT, DIRECT, 和RECORDLENGTH)

数据泵无需设置这些参数,它本身会找到最适合的方式来进行动作

注意数据泵只有Parallelism参数来提升性能


##6. 不同版本间的数据移动

原始的imp/exp工具针对不同版本的数据库,

如需要从11g导出数据并导入到10g的数据库中,需要使用10g的exp工具导出数据


而数据泵则可以使用11g的exodp导出数据，只需要指定version参数

注意不可以指定10g以前的版本号因为那是并不存在数据泵

同时impdp无法读取exp出来的数据

```
> expdp username/password TABLES=hr.employees VERSION=10.1
DIRECTORY=dpump_dir1 DUMPFILE=emp.dmp
```

##7.并行度数据泵

我们可以使用Parallelism参数来提高expdp和impdp的性能(仅支持企业版)

我们可以通过命令行工具更改并行度

为达到并行的最大性能，需要满足如下条件

1. 保证操作系统资源足够(CPU,内存)
2. 为每个并行度分配一个dump文件
3. 为每个dump文件分配不同的磁盘用来提供IO性能
4. 对于expdp来说可以使用%U变量来讲dump文件分割成多个文件

```
> expdp username/password DIRECTORY=dpump_dir1 JOB_NAME=hr
DUMPFILE=par_exp%u.dmp PARALLEL=4
```

```
> expdp hr full=y dumpfile=dpump_dir1:full1%u.dmp, dpump_dir2:full2%u.dmp
filesize=2g parallel=3 logfile=dpump_dir1:expfull.log job_name=expfull
```


##8.REMAP参数

###8.1 REMAP_TABLESPACE

该参数可以将表导入到不同的表空间中

```
> impdp username/password REMAP_TABLESPACE=tbs_1:tbs_6
DIRECTORY=dpumpdir1 DUMPFILE=employees.dmp
```

###8.2  REMAP_DATAFILES

该参数可以在impdp中将数据文件映射为不同的数据文件

由于数据文件名称需要用引号，这里推荐使用参数文件
```
vim payroll.par

DIRECTORY=dpump_dir1
FULL=Y
DUMPFILE=db_full.dmp
REMAP_DATAFILE=”’C:\DB1\HRDATA\PAYROLL\tbs6.dbf’:’/db1/hrdata/payroll/tbs6.dbf
’”
```

```
> impdp username/password PARFILE=payroll.par
```

##9.数据泵一些其他功能


###9.1 交互式命令行工具

由于数据泵是服务端工具我们可以运行一个expdp或impdp Job,然后退出(detach)它,然后在需要时重新连接并监控它

- 查看Job的状态
- 当磁盘空间不足时增加新的dump文件
- 更改默认的dump文件大小
- 停止然后把重新启动它
- 重启它
- 增加和减少并行度
- 从远程数据连接它并监控状态

可以使用如下试图查看JOB情况

- DBA_DATAPUMP_JOBS - all active Data Pump jobs and the state of each job
- USER_DATAPUMP_JOBS – summary of the user’s active Data Pump jobs
- DBA_DATAPUMP_SESSIONS – all active user sessions that are attached to a Data Pump
job
- V$SESSION_LONGOPS – shows all progress on each active Data Pump job


###9.2 Network Mode

我们可以使用Network Mode 来export 只读数据库,例如Standby database

使用network_link参数

具体可参考

```
https://asktom.oracle.com/pls/asktom/f?p=100:11:0::::P11_QUESTION_ID:9530201800346481934
```

###9.3 生成SQLFILE

我们可以是expdp生成数据库对象的DDL语句

```
> impdp username/password DIRECTORY=dpumpdir1 DUMPFILE=expfull.dmp
SQLFILE=dpump_dir2:expfull.sql INCLUDE=TABLE,INDEX
```
1.Oracle数据泵介绍 data-pump