长江三峡NC系统集群配置及数据库维护方案王辉2009-03-25wanghui001@ufida.com.cn1.集群拓扑图1.1硬件拓扑图1.2进程拓扑图1.3集群说明1.应用集群:NC采用水平集群(如果是高配置服务器需要两台,低配置需要三台),IUFO采用单机垂直集群。2.数据库:建议使用HA。要求数据库配置为所有应用服务器配置的总和。例:应用服务器三台,每台4C8G,那么要求数据库为12C24G。3.web服务器:建议采用一台单独的服务器做web服务器。4.交换机:数据库和应用服务器之间通过光纤交换机链接。2.硬件与网络配置2.1并发用户信息系统当前最大在线人数NC部分为350人,HR为100人,工450人,加上将来新增的用户250人,总共将达到700人的并发。2.2配置标准计算WAS集群中,一个server最大负载不能超过150人,最好为100人左右。根据将来最大并发700人计算,需要配置5-7个server。考虑系统效率和高可用性,建议采用7个server,这样就需要高配置服务器两台或者稍低配置的服务器三台做应用服务器。数据库建议使用HA做双机热备。2.3硬件推荐参考配置产品名称产品型号配置说明数量应用服务器PowerPC_POWER4(当前服务器)每台服务器添加两颗CPU,8G内存,达到4CPU,16G内存标准2数据库服务器推荐1:SystemX39508*3.5GHzIntelXeonMPCPU32GBmemory4x73.4GBSAS硬盘1推荐2:稍低配置两台做RAC4C16G2WEB服务器2C4G,建议采用冗余22.4网络要求内网:响应延时<50ms丢包率<1%外网:响应延时<100ms丢包率<小于3%网络带宽:内部建议1000MB网口3.数据库备份方法与策略3.1EXP/IMP逻辑备份3.1.1使用方法Expparameter_name=valueOrExpparameter_name=(value1,value2……)只要输入参数help=y就可以看到所有帮助如:C:\>setnls_lang=simplifiedchinese_china.zhs16gbkC:\>exp-helpExport:Release8.1.6.0.0-Productionon星期四4月1019:09:212003(c)Copyright1999OracleCorporation.Allrightsreserved.通过输入EXP命令和用户名/口令,您可以在用户/口令之后的命令:实例:EXPSCOTT/TIGER或者,您也可以通过输入跟有各种参数的EXP命令来控制“导出”的运行方式。要指定参数,您可以使用关键字:格式:EXPKEYWORD=value或KEYWORD=(value1,value2,...,valueN)实例:EXPSCOTT/TIGERGRANTS=YTABLES=(EMP,DEPT,MGR)或TABLES=(T1:P1,T1:P2),如果T1是分区表USERID必须是命令行中的第一个参数。关键字说明(默认)关键字说明(默认)--------------------------------------------------------------------------USERID用户名/口令FULL导出整个文件(N)BUFFER数据缓冲区的大小OWNER所有者用户名列表FILE输出文件(EXPDAT.DMP)TABLES表名列表COMPRESS导入一个范围(Y)RECORDLENGTHIO记录的长度GRANTS导出权限(Y)INCTYPE增量导出类型INDEXES导出索引(Y)RECORD跟踪增量导出(Y)ROWS导出数据行(Y)PARFILE参数文件名CONSTRAINTS导出限制(Y)CONSISTENT交叉表一致性LOG屏幕输出的日志文件STATISTICS分析对象(ESTIMATE)DIRECT直接路径(N)TRIGGERS导出触发器(Y)FEEDBACK显示每x行(0)的进度FILESIZE各转储文件的最大尺寸QUERY选定导出表子集的子句下列关键字仅用于可传输的表空间TRANSPORT_TABLESPACE导出可传输的表空间元数据(N)TABLESPACES将传输的表空间列表在没有警告的情况下成功终止导出。C:\>帮助已经很详细的说明了参数的意义和使用方法,并列举了几个简单的例子,注意的是,从8i开始,已经开始支持数据子集的方法,就是可以指定自己的Where条件,可以从表中导出一行或多行数据。注意上面的setnls_lang=simplifiedchinese_china.zhs16gbk,通过设置环境变量,可以让exp的帮助以中文显示,如果setnls_lang=American_america.字符集,那么你的帮助就是英文的了。增量和累计导出必须在全库方式下才有效,而且,大多数情况下,增量和累计导出并没有想象中的那么有效。ORACLE从9i开始,不再支持增量导出和累计导出。3.1.2导出/导入与字符集明白ORACLE的多国语言设置,ORACLE多国语言设置是为了支持世界范围的语言与字符集,一般对语言提示,货币形式,排序方式和CHAR,VARCHAR2,CLOB,LONG字段的数据的显示等有效。ORACLE的多国语言设置最主要的两个特性就是国家语言设置与字符集设置,国家语言设置决定了界面或提示使用的语言种类,字符集决定了数据库保存与字符集有关数据(如文本)时候的编码规则。正如刚才上面的一个小例子,环境变量NLS_LANG的不同,导致EXP帮助发生变化,这就是多国语言设置的作用(NLS_LANG包含国家语言设置与字符集设置,这里起作用的是国家语言设置,而不是字符集)。ORACLE字符集设定,分为数据库字符集和客户端字符集环境设置。在数据库端,字符集在创建数据库的时候设定,并保存在数据库props$表中,对于8i以上产品,已经可以采用“Alterdatabasecharacterset字符集”来修改数据库的字符集,但也仅仅是从子集到超集,不要通过updateprops$来修改字符集,如果是不支持的转换,可能会失去所有与字符集有关的数据,就是支持的转换,也可能导致数据库的不正常工作。字符集分为单字节字符集与多字节字符集,US7ASCII就是典型的单字节字符集,在这种字符集中length=lengthb,而ZHS16GBK就是常用的双字节字符集,在这里lengthb=2*length。在客户端的字符集环境比较简单,主要就是环境变量或注册表项NLS_LANG,注意NLS_LANG的优先级别为:参数文件注册表环境变量altersession。NLS_LANG的组成为“国家语言设置.字符集”,如nls_lang=simplifiedchinese_china.zhs16gbk。客户端的字符集最好与数据库端一样(国家语言设置可以不一样,如zhs16gbk的字符集,客户端可以是nls_lang=simplifiedchinese_china.zhs16gbk或Ameircan_America.zhs16gbk,都不影响数据库字符的正常显示),如果字符集不一样,而且字符集的转换也不兼容,那么客户端的数据显示与导出/导入的与字符集有关的数据将都是乱码。使用一点点技巧,就可以使导出/导入在不同的字符集的数据库上转换数据。这里需要一个2进制文件编辑工具即可,如uedit32。用编辑方式打开导出的dmp文件,获取2、3字节的内容,如0001,先把它转换为10进制数,为1,使用函数NLS_CHARSET_NAME即可获得该字符集:SQL>selectnls_charset_name(1)fromdual;NLS_CHARSET_NAME(1)-------------------US7ASCII可以知道该dmp文件的字符集为US7ASCII,如果需要把该dmp文件的字符集换成ZHS16GBK,则需要用NLS_CHARSET_ID获取该字符集的编号:SQL>selectnls_charset_id('zhs16gbk')fromdual;NLS_CHARSET_ID('ZHS16GBK')--------------------------852把852换成16进制数,为354,把2、3字节的0001换成0354,即完成了把该dmp文件字符集从us7ascii到zhs16gbk的转化,这样,再把该dmp文件导入到zhs16gbk字符集的数据库就可以了。(注意,十进制数与十六进制之间的转换,想明白其中的道理)3.1.3跨版本使用Exp/ImpExp/Imp很多时候,可以跨版本使用,如在版本7与版本8之间导出导入数据,但这样做必须选择正确的版本,规则为:·总是使用IMP的版本匹配数据库的版本,如果要导入到816,则使用816的导入工具。·总是使用EXP的版本匹配两个数据库中低的那个版本,如在815与816之间互导,则使用815的EXP工具。3.2OS备份操作系统备份有两类,冷备份(Coldbackup)与热备份(Hotbackup),操作系统备份与以上的逻辑备份有本质的区别。逻辑备份提取数据库的数据内容,而不备份物理数据块。而操作系统备份则是拷贝整个的数据文件。3.2.1冷备份在文件级备份开始前数据库必须彻底关闭。关闭操作必须用带有normal、immediate、transaction选项的shutdown来执行。数据库使用的每个文件都被备份下来,这些文件包括:☆所有数据文件☆所有控制文件☆所有联机REDOLOG文件INIT.ORA☆文件(可选)作冷备份一般步骤是:a.正常关闭要备份的实例(instance);b.备份整个数据库到一个目录c.启动数据库如SVRMGRL>connectinternalSVRMGRL>shutdownimmediateSVRMGRL>!cp或SVRMGRL>!tarcvf/dev/rmt/0/u01/oradata/prodSVRMGRL>startup注意:如果利用脚本对数据库进行冷备份,必须对关闭数据库的命令进行逻辑检查,如果发生关闭数据库的命令不能正常执行而导致数据库没有正常关闭,那么,所有的冷备份将回是无效的。3.2.2热备份热备份是当数据库打开并对用户有效是的OS级的数据备份。热备份只能用于ARCHIVELOG方式的数据库。在数据文件备份之前,对应的表空间必须通过使用ALTERTABLESPACE……BEGINBACKUP以备份方式放置。然后组成表空间的数据文件可以使用类似冷备份的操作系统命令进行拷贝。在数据文件用操作系统命令拷贝后,应使用ALTERTABLESPACE……ENDBACKUP命令使表空间脱离热备份方式。热备份没有必要备份联机日志,但必须是归档状态,在实例恢复的时候,可能需要用到归档日志。当前联机日志一定要保护好或是处于镜相状态,当前联机日志的损坏,对于数据库的损坏是巨大的,只能以数据的丢失来进行数据库的恢复工作。对于临时表空间,存放的是临时信息,在热备份是也可以考虑不用备份,如果临时文件发生故障,可以删除该数据文件与表空间,重建一个临时表空间。热备份的优点是显而易见的----a.可在表空间或数据文件级备份,备份时间短。----b.备份时数据库仍可使用。----c.可达到秒级恢复(恢复到某一时间点上)。----d.可对几乎所有数据库实体作恢复。----e.恢复是快速的,在大多数情况下在数据库仍工作时恢复。操作系统作热备份的一般步骤为:1.连接数据库SVRMGRL>connectinternal;2.将需要备份的表空间(如User)设置为备份方式SVRMGRL>AltertablespaceUserbeginbackup;3.拷贝数据文件SVRMGRL>!cp/u01/oradata/prod/user01.ora/backup/prod/user01.oraOr$cpcp/u01/oradata/prod/user01.ora/backup/prod/user01.ora4.在数据文件拷贝完成后,将表空间拖体备份方式SVRMGRL>AltertablespaceUserendbackup;5.对所有需要备份的表空间重复2,3,46.使用如下的命令备份控制文件ALTERDATABSE……BACKUPCONTROLFILE如备份成二进制文件alterdatabasebackupcontrolfileto‘newfielname’;备份成文本文件alterdatabasebackupcontrolfiletotrace;因为热备份的时候,用户还在操作数据库,所以,最好是每个表空间处于备份状态的时间最短,这样就要求一个表空间一个表空间的备份,不要一起使表空间处于备份状态而同时拷贝数据文件。注意:如果在热备份的时候如果数据库中断(如断电),那么在重新启动数据库的时候,数据库将提示有数据文件需要恢复,你需要把正在断电时候的处于备份状态的数据文件通过ALTERTABLESPACE……ENDBACKUP结束备份方式。具体哪个数据文件或表空间处于备份状态,可以通过v$backup与v$datafile来获得3.3RMAN(备份与恢复管理器)3.3.1了解RMANRecoverymanager(RMAN)是ORACLE提供的DBA工具,用于管理备份和恢复操作。RMAN只能用于ORACLE8或更高的版本中。它能够备份整个数据库或数据库部件,其中包括表空间、数据文件,控制文件和归档文件。RMAN可以按要求存取和执行备份和恢复。RMAN备份有如下优点☆支持在线热备份☆支持多级增量备份☆支持并行备份、恢复☆减少备份量☆备份、恢复使用简单重要的是,使用恢复管理器允许您进行增量数据块级的备份。增量RMAN备份是时间和空间有效的,因为他们只备份自上次备份以来有变化的那些数据块。另一个空间有效的RMAN特性是它只备份数据文件中使用的数据块,忽略空的,未用的数据块,这个对于预分配空间的表空间有很大的好处。从9i开始,还增加了RMAN的数据块级别的恢复,可以进一步减少数据库恢复时间。RMAN支持以下不同类型的备份FULL数据库全备份,包括所有的数据块INCREMENTAL增量备份,只备份自上次增量备份以来修改过的数据块。需要一个0级的增量作为增量的基础,可以支持7级增量。OPEN在数据库打开的时候使用CLOSED在数据库安装(MOUNT)但不打开的时候备份,关闭备份可以是CONSISTENT或INCONSISTENT类型的。CONSISTENT在数据库安装,单不打开,并且在安装之前数据库被彻底关闭(而不是被破坏或异常退出)时使用。CONSISTENT备份可以简单的进行复原(RESTORE)而不是恢复(RECOVER)INCONSISTENT在数据库打开或安装(但不打开)时使用。在该数据库正常关闭或崩溃后,INCONSISTENT备份需要恢复。理解BACKUP,RESTORE,RECOVER命令,这是RMAN最基本的三个命令,可以进行数据库的备份,复原以及恢复操作。3.3.2了解恢复目录理解恢复目录,RMAN可以在没有恢复目录(NOCATALOG)下运行,这个时候备份信息保存在控制文件。保存在控制文件的备份信息是很危险的,如果控制文件的破坏将导致备份信息的丢失与恢复的失败,而且,没有恢复目录,很多RMAN的命令将不被支持。所以对于重要的数据库,建议创建恢复目录,恢复目录也是一个数据库,只不过这个数据库用来保存备份信息,一个恢复目录可以用来备份多个数据库。创建RMAN目录,以下步骤说明了在一个数据库中创建RMAN目录的过程。1.为目录创建一个单独的表空间SQL>Createtablespacetoolsdatafile‘fielname’size50m;2.创建RMAN用户SQL>CreateuserRMANidentifiedbyRMANdefaulttablespacetoolstemporarytablespacetemp;3.给RMAN授予权限SQL>Grantconnect,resource,recovery_catalog_ownertorman;4.打开RMAN$>RMAN5.连接数据库RMAN>connectcatalogrman/rman6.创建恢复目录RMAN>Createcatalogtablespacetools注册目标数据库,恢复目录创建成功后,就可以注册目标数据库了,目标数据库就是需要备份的数据库,一个恢复目录可以注册多个目标数据库,注册目标数据库的命令为:$>RMANtargetsystem/passwordcatalogrman/rman@rcdb;RMAN>Registerdatabase;数据库注册完成,就可以用RMAN来进行备份了,更多命令请参考ORACLE联机手册或《ORACLE备份与恢复手册》。注销数据库需要运行一个程序包,过程如下:1.连接目标数据库,获得目标数据库ID$>RMANtargetsystem/passwordcatalogrman/rman@rcdb;RMAN-06005:connectedtotargetdatabase:RMAN(DBID=1231209694)2.查询恢复目录,得到更详细的信息SQL>SELECTdb_key,db_idFROMdbWHEREdb_id=1231209694;DB_KEYDB_ID-------------------------112376032941rowselected.3.运行过程dbms_rcvcat.unregisterdatabase注销数据库,如SQL>EXECUTEdbms_rcvcat.unregisterdatabase(1,1237603294)3.3.3采用RMAN进行备份RMAN使用脚本来备份数据库,以下是RMAN进行备份的几个例子。1.备份整个数据库backupfulltag‘basicdb’format‘/bak/oradata/full_%u_%s_%p’database;2.备份一个表空间backuptag‘tsuser’format‘/bak/oradata/tsuser_%u_%s_%p’tablespaceusers;3.备份归档日志backuptag‘alog’format‘/bak/archivebak/arcbak_%u_%s_%p’archivelogalldeleteinput;3.3.4查看RMAN的信息检查现有备份RMAN>listbackup列出过期备份RMAN>reportobsolete删除过期的备份RMAN>allocatechannelformaintenancetypedisk;RMAN>changebackupsetiddelete;RMAN>releasechannel;3.2.5同步或重置RMAN如果目标数据库物理对象发生了变化,如添加了一个数据文件,需要用如下命令同步:RMAN>resynccatalog;如果目标数据库reset了数据库,需要用如下命令同步RMAN>resetdatabase;当手工删除了数据库的归档文件后,要执行以下脚本同步RMAN>allocatechannelformaintenancetypedisk;RMAN>changearchivelogallcrosscheck;RMAN>releasechannel;当手工删除了数据库的RMAN备份后,要执行以下脚本来同步RMAN>allocatechannelformaintenancetypedisk;RMAN>crosscheckbackup;RMAN>deleteexpirebackup;RMAN>releasechannel;3.4备份策略正确的备份策略不仅能保证数据库服务器的24*7的高性能的运行,还能保证备份与恢复的快速性与可靠性。我们将以RMAN的多级增量备份作为一个备份策略的例子来讨论。采用多级备份就是为了减少每天备份所需要的时间,而又保证系统有良好的恢复性。恢复时间与备份时间要有一个权衡。比如只要进行一个数据库的全备份,然后就只备份归档也可以保证能把数据库恢复到最新的状态,但是这样的恢复时间将是不可容忍的。多级备份也正是为了解决这种问题,以下就是一个多级备份的例子:每半年做一个数据库的全备份(包括所有的数据和只读表空间)每一个月做一次零级备份(不包含只读表空间)每个星期做一次一级备份每天做一次二级备份任何数据库的更改需要重新同步CATALOG目录并重新备份(如添加数据文件)或重新备份(如修改表空间为只读)每次备份后都可以备份归档日志或定期备份归档日志。如果可能,可以直接备份到磁带上。数据库全备份的脚本run{allocatechannelc1typedisk;allocatechannelc2typedisk;allocatechannelc3typedisk;backupfulltag‘dbfull’format‘/u01/oradata/backup/full%u_%s_%p’databaseincludecurrentcontrolfile;sql‘altersystemarchivelogcurrent’;backupfilesperset3format‘/u01/oradata/backup/arch%u_%s_%p’archivelogalldeleteinput;#备份归档可选,可以单独定期备份releasechannelc1;releasechannelc2;releasechannelc3;}零级备份的脚本run{allocatechannelc1typedisk;allocatechannelc2typedisk;allocatechannelc3typedisk;backupincrementallevel0tag‘db0’format‘/u01/oradata/backup/db0%u_%s_%p’databaseskipreadonly;sql‘altersystemarchivelogcurrent’;backupfilesperset3format‘/u01/oradata/backup/arch%u_%s_%p’archivelogalldeleteinput;#备份归档可选,可以单独定期备份releasechannelc1;releasechannelc2;releasechannelc3;}同理,我们可以得到一级备份,二级备份的脚本,如一级备份的脚本run{allocatechannelc1typedisk;allocatechannelc2typedisk;allocatechannelc3typedisk;backupincrementallevel1tag‘db1’format‘/u01/oradata/backup/db1%u_%s_%p’databaseskipreadonly;sql‘altersystemarchivelogcurrent’;backupfilesperset3format‘/u01/oradata/backup/arch%u_%s_%p’archivelogalldeleteinput;#备份归档可选,可以单独定期备份releasechannelc1;releasechannelc2;releasechannelc3;}如果按照以上备份策略,则每天的所需要备份的数据量只有一天的改变量。而做恢复时最多要恢复当月的一个零级备份+三个一级备份+6个二级备份+当天的归档文件。如果不能接受这样的恢复时间,可以减少零级备份之间的时间间隔。在每次备份后,原则上在该备份点之前的归档日志就可以删除掉了,但是为了进一步的安全以及日后需要(如使用LOGMNR查找所需信息),建议有条件的话,归档日志保存一年,可以保存在磁带等廉价存取设备上。