本文來源于網頁設計愛好者web開發社區http://www.html.org.cn收集整理,歡迎訪問。
一. 理解什么是數據庫恢復
   當我們使用一個數據庫時,總希望數據庫的內容是可靠的、正確的,但由于計算機系統的故障(硬件故障、軟件故障、網絡故障、進程故障和系統故障)影響數據庫系統的操作,影響數據庫中數據的正確性,甚至破壞數據庫,使數據庫中全部或部分數據丟失。因此當發生上述故障后,希望能重構這個完整的數據庫,該處理稱為數據庫恢復。恢復過程大致可以分為復原(restore)與恢復(recover)過程。
 
數據庫恢復可以分為以下兩類:
 
1.1實例故障的一致性恢復
當實例意外地(如掉電、后臺進程故障等)或預料地(發出shutdoum abort語句)中止時出現實例故障,此時需要實例恢復。實例恢復將數據庫恢復到故障之前的事務一致狀態。如果在在線后備發現實例故障,則需介質恢復。在其它情況oracle在下次數據庫起動時(對新實例裝配和打開),自動地執行實例恢復。如果需要,從裝配狀態變為打開狀態,自動地激發實例恢復,由下列處理:
(1) 為了解恢復數據文件中沒有記錄的數據,進行向前滾。該數據記錄在在線日志,
包括對回滾段的內容恢復。
(2) 回滾未提交的事務,按步1重新生成回滾段所指定的操作。
(3) 釋放在故障時正在處理事務所持有的資源。
(4) 解決在故障時正經歷一階段提交的任何懸而未決的分布事務。
1.2介質故障或文件錯誤的不一致恢復
介質故障是當一個文件、一個文件的部分或磁盤不能讀或不能寫時出現的故障。文件錯誤一般指意外的錯誤導致文件被刪除或意外事故導致文件的不一致。這種狀態下的數據庫都是不一致的,需要dba手工來進行數據庫的恢復,這種恢復有兩種形式,決定于數據庫運行的歸檔方式和備份方式。
 
(1) 完全介質恢復可恢復全部丟失的修改。一般情況下需要有數據庫的備份且數據庫運行在歸檔狀態下并且有可用歸檔日志時才可能。對于不同類型的錯誤,有不同類型的完全恢復可使用,其決定于毀壞文件和數據庫的可用性。
 
(2) 不完全介質恢復是在完全介質恢復不可能或不要求時進行的介質恢復。重構受損的數據庫,使其恢復介質故障前或用戶出錯之前的一個事務一致性狀態。不完全介質恢復有不同類型的使用,決定于需要不完全介質恢復的情況,有下列類型:基于撤消、基于時間和基于修改的不完全恢復。
基于撤消(cancel)恢復:在某種情況,不完全介質恢復必須被控制,dba可撤消在指定點的操作。基于撤消的恢復地在一個或多個日志組(在線的或歸檔的)已被介質故障所破壞,不能用于恢復過程時使用,所以介質恢復必須控制,以致在使用最近的、未損的日志組于數據文件后中止恢復操作。
 
基于時間(time)和基于修改(scn)的恢復:如果dba希望恢復到過去的某個指定點,是一種理想的不完全介質恢復,一般發生在恢復到某個特定操作之前,恢復到如意外刪除某個數據表之前。
 
第二章. 數據庫恢復案例測試環境
2.1 數據庫環境
以下的所有案例都是通過測試經過,環境為:
  os:windows 2000 server
  db:oracle 816
  dbname:test
數據文件:
sql> select file#,status,enabled,name from v$datafile;
 
    file# status  enabled      name
----------------------------------------------------------------
         1 system  read write d:/oracle/oradata/test ystem01.dbf
         2 online  read write d:/oracle/oradata/test/rbs01.dbf
         3 online  read write d:/oracle/oradata/test/users01.dbf
         4 online  read write d:/oracle/oradata/test/temp01.dbf
         5 online  read write d:/oracle/oradata/test/tools01.dbf
         6 online  read write d:/oracle/oradata/test/indx01.dbf
控制文件:
sql> select * from v$controlfile;
 
status  name
---------------------------------------------------------------------
        d:/oracle/oradata/test/control01.ctl
        d:/oracle/oradata/test/control02.ctl
        d:/oracle/oradata/test/control03.ctl
聯機日志:
sql> select * from v$logfile;
 
    group# status      member
---------------------------------------------------------------------
      1     stale      d:/oracle/oradata/test/redo01.log
      2               d:/oracle/oradata/test/redo02.log
      3     stale      d:/oracle/oradata/test/redo03.log
 
2.2 數據庫備份腳本
冷備份腳本:
rem     script:coldbak.sql
rem     creater:chenjiping
rem     date:5.8.2003
rem     desc:offline full backup database 
 
--connect database
connect internal/password;
--shutdown database
shutdown immediate;
--copy data file
!xcopy d:/oracle/oradata/test/*.dbf d:/database/h/r; 
--copy control file
!xcopy d:/oracle/oradata/test/*.ctl d:/database/h/r;
--copy log file
!xcopy d:/oracle/oradata/test/*.log d:/database/h/r;
--startup database
startup;
 
說明:
1、以上腳本在數據庫關閉狀態下備份數據庫所有的數據文件,聯機日志,控制文件(在一個目
錄下),如果成功備份,所有文件是一致的;
2、沒有備份參數文件,參數文件可以另外備份,沒有必要每次都備份,只需要在改變設置后備份一次;
3、如果以上命令沒有成功依次執行,那么備份將是無效的,如連接數據庫不成功,那么肯定關閉數據庫也不成功,那么備份則無效;
4、冷備份建議下人工干預下執行。
 
數據庫os熱全備份腳本
rem     script:hotbak.sql
rem     creater:chenjiping
rem     date:5.8.2003
rem     desc:backup all database datafile in archive
 
--connect database
connect internal/password;
 
--archive
alter system archive log current;
--start
 
alter tablespace system begin backup;
!xcopy d:/oracle/oradata/test ystem01.dbf d:/databak/h/r;
alter tablespace system end backup;
 
alter tablespace rbs begin backup;
!xcopy d:/oracle/oradata/test/rbs01.dbf d:/databak/h/r;
alter tablespace rbs end backup;
 
alter tablespace users begin backup;
!xcopy d:/oracle/oradata/test/users01.dbf d:/databak/h/r;
alter tablespace users end backup;
 
alter tablespace tools begin backup;
!xcopy d:/oracle/oradata/test/tools01.dbf d:/databak/h/r;
alter tablespace tools end backup;
 
alter tablespace indx begin backup;
!xcopy d:/oracle/oradata/test/indx01.dbf d:/databak/h/r;
alter tablespace indx end backup;
--end
 
--bak control file
--binary
alter database backup controlfile to 'd:/databak/controlbinbak.000';
--ascii
alter database backup controlfile to trace;
 
alter system archive log current;
說明:
1、熱備份必須在數據庫歸檔方式下才可以運行;
2、以上腳本可以在數據庫運行狀態下備份數據庫所有的數據文件(除了臨時數據文件),沒有必要備份聯機日志;
3、歸檔日志至少需要一次完整備份之后的所有日志;
4、如果以上命令沒有成功依次執行,那么備份也是無效的,如連接數據庫不成功,那么備份則無效。
 
rman備份只講敘有恢復目錄的情況,如果沒有恢復目錄,情形大致相似。以下是rman的熱備份全備份的腳本:
#   script:bakup.rcv
#   creater:chenjiping
#   date:5.8.2003
#   desc:backup all database datafile in archive with rman
 
# connect database
connect rcvcat rman/[email protected];
connect target internal/virpure;
 
# start backup database
run{
allocate channel c1 type disk;
backup full tag 'dbfull' format 'd:/backup/full%u_%s_%p' database
include current controlfile;
sql 'alter system archive log current';
release channel c1;
}
# end
 
說明:
1、 數據庫必須運行在歸檔模式下;
2、 rman將自動備份數據文件,運行可靠;
3、 歸檔日志另外備份處理,但至少需要保存一次備份來的日志;
4、 沒有必要用rman做冷備份,效果不好。
 
以上舉例說明了數據庫的恢復案例的測試環境與部分備份測試腳本,其它的備份腳本可以根據以上腳本演變而來或在案例中加以說明。
數據庫的自動實例將不加以說明,這里只舉例說明媒體錯誤或人為錯誤造成的恢復可能。
以上包括以下案例都是在windows+oracle816上測試驗證的,在不同的操作系統與不同的數據庫版本中略有差別。
 
第三章. 了解與恢復相關的信息
 
1、 理解報警日志文件
報警日志文件一般記載了數據庫的啟動/關閉信息,歸檔信息,備份信息,恢復信息,常見錯誤信息,部分數據庫修改記錄等。一般令名規則為<sid>alrt.log或alrt<sid>.log,如我的測試數據庫的報警日志文件的名稱為testalrt.log。
 
報警日志文件的路徑是根據初始化參數background_dump_dest來決定的,如在我的機器上,該參數值為 d:/oracle/admin/test/bdump,那么,你就可以在該路徑下找到該文件。
2、 后臺進程跟蹤文件
后臺進程跟蹤文件的路徑與報警日志文件的路徑一致,在某些情況下,你可以通過后臺跟蹤文件的信息了解更多的需要恢復的信息。如在數據庫需要恢復的時候,報警日志文件中常有這樣的語句:
errors in file d:/oracle/admin/test/bdump/testdbw0.trc:
ora-01157: cannot identify/lock data file 1 - see dbwr trace file
通過提示的dbwr跟蹤文件,可以查詢到更詳細的信息。
3、 v$recover_file與v$recovery_log
這是兩個動態性能視圖,可以在mount下查看,通過這兩個視圖,你可以了解詳細的需要恢復的數據文件與需要使用到的歸檔日志。
第四章. 數據庫恢復案例
4.1非歸檔模式下的備份與恢復
備份方案:采用os冷備份
 
1.  連接數據庫并創建測試表
sql> connect internal/password as sysdba;
connected.
sql> create table test(a int);
table created
sql> insert into test values(1);
1 row inserted
sql> commit;
commit complete
 
2.  備份數據庫
sql> @coldbak.sql 或在dos下 svrmgrl @coldbak.sql
 
3.  再插入記錄
sql> insert into test values(2);
1 row inserted
sql> commit;
commit complete
sql> select * from test;
                         a
-------------------
                         1
                         2
4.  關閉數據庫
sql> shutdown immediate;
database closed.
database dismounted.
oracle instance shut down.
 
5.  毀壞一個或多個數據文件,如刪除user01.dbf
c:/>del d:/oracle/oradata/test/users01.dbf
模擬媒體毀壞。
 
6.  重新啟動數據庫,會發現如下錯誤
sql> startup
oracle instance started.
 
total system global area  102020364 bytes
fixed size                    70924 bytes
variable size              85487616 bytes
database buffers           16384000 bytes
redo buffers                  77824 bytes
database mounted.
ora-01157: cannot identify/lock data file 3 - see dbwr trace file
ora-01110: data file 3: 'd:/oracle/oradata/test/users01.dbf'
 
在報警文件中,會有更詳細的信息
errors in file d:/oracle/admin/test/bdump/testdbw0.trc:
ora-01157: cannot identify/lock data file 3 - see dbwr trace file
ora-01110: data file 3: 'd:/oracle/oradata/test/users01.dbf'
ora-27041: unable to open file
osd-04002: unable to open file
o/s-error: (os 2) 系統找不到指定的文件。
 
7.  拷貝備份復原到原來位置(restore過程)
c:/>xcopy d:/database/*.* d:/oracle/oradata/test/h/r/s
 
8.  打開數據庫,檢查數據
sql> alter database open;
database altered.
sql> select * from test;
                         a
---------------------------------------
                         1
 
這里可以發現,數據庫恢復成功,但在備份之后與崩潰之前的數據丟失了。
說明:
1、非歸檔模式下的恢復方案可選性很小,一般情況下只能有一種恢復方式,就是數據庫的冷備
份的完全恢復,僅僅需要拷貝原來的備份就可以(restore),不需要recover;
2、這種情況下的恢復,可以完全恢復到備份的點上,但是可能是丟失數據的,在備份之后與崩潰之前的數據將全部丟失;
3、不管毀壞了多少數據文件或是聯機日志或是控制文件,都可以通過這個辦法恢復,因為這個恢復過程是restore所有的冷備份文件,而這個備份點上的所有文件是一致的,與最新的數據庫沒有關系,就好比把數據庫又放到了一個以前的"點"上;
4、對于非歸檔模式下,最好的辦法就是采用os的冷備份,建議不要用rman來作冷備份,效果不好,因為rman不備份聯機日志,restore不能根本解決問題;
5、如果沒有備份聯機日志,如rman的備份,就需要利用不完全恢復(until cancel)的方法來重新創建聯機日志文件。
4.2歸檔模式下丟失或損壞一個數據文件
4.2.1 os備份方案
在歸檔方式下損壞或丟失一個數據文件,如果存在相應的備份與該備份以來的歸檔日志,恢復還是比較簡單的,可以作到盡量少的down機時間,并能作到數據庫的完全恢復。
1、 連接數據庫,創建測試表并插入記錄
sql> connect internal/password as sysdba;
connected.
sql> create table test(a int) tablespace users;
table created
sql> insert into test values(1);
1 row inserted
sql> commit;
commit complete
 
2、 備份數據庫
sql> @hotbak.sql 或在dos下 svrmgrl @hotbak.sql
 
3、 繼續在測試表中插入記錄
sql> insert into test values(2);
1 row inserted
sql> commit;
commit complete
sql> select * from test;
                         a
    --------------------------------------
                         1
                         2
sql> alter system switch logfile;
system altered.
sql> alter system switch logfile;
system altered.
 
4、 關閉數據庫,模擬丟失數據文件
sql> shutdown immediate;
database closed.
database dismounted.
oracle instance shut down
c:/>del d:/oracle/oradata/test/users01.dbf
模擬媒體毀壞。
 
5、 啟動數據庫錯誤,脫機該數據文件:
sql> startup
oracle instance started.
 
total system global area  102020364 bytes
fixed size                    70924 bytes
variable size              85487616 bytes
database buffers           16384000 bytes
redo buffers                  77824 bytes
database mounted.
ora-01157: cannot identify/lock data file 3 - see dbwr trace file
ora-01110: data file 3: 'd:/oracle/oradata/test/users01.dbf'
還可以查看報警文件(見上一個恢復案例)或動態視圖v$recover_file
如sql> select * from v$recover_file;
 
     file# online  error                    change#     time
---------- ------- ------------------ ---------- -----------
         3   online                        1013500    2003-05-07
 
脫機數據文件
sql> alter database datafile 3 offline drop;
database altered.
 
6、 打開數據庫,拷貝備份回來(restore),恢復(recover)該數據文件,并聯機:
sql> alter database open;
database altered.
拷貝備份從備份處
copy d:/databak/ users01.dbf d:/oracle/oradata/test;
恢復該數據文件
sql> recover datafile 3;
ora-00279: change 1053698 generated at 05/07/2003 17:51:26 needed for 
thread 1
ora-00289: suggestion : 
d:/oracle/oradata/test/archive/testt001s00304.arc
ora-00280: change 1053698 for thread 1 is in sequence #304
 
specify log: {<ret>=suggested | filename | auto | cancel}
auto
ora-00279: change 1053701 generated at 05/07/2003 17:51:39 needed for 
thread 1
ora-00289: suggestion : d:/oracle/oradata/test/archive/testt001s00305.arc
ora-00280: change 1053701 for thread 1 is in sequence #305
ora-00278: log file 'd:/oracle/oradata/test/archive/testt001s00304.arc' no longer needed for this recovery log applied.
media recovery complete.
恢復成功,聯機該數據文件
sql> alter database datafile 3 online;
database altered.
 
7、 檢查數據庫的數據(完全恢復)
sql> select * from test;
                         a
--------------------------------
                         1
                         2
說明:
1、采用熱備份,需要運行在歸檔模式下,可以實現數據庫的完全恢復,也就是說,從備份后到數據庫崩潰時的數據都不會丟失;
2、可以采用全備份數據庫的方式備份,對于特殊情況,也可以只備份特定的數據文件,如只備份用戶表空間(一般情況下對于某些寫特別頻繁的數據文件,可以單獨加大備份頻率);
3、如果在恢復過程中,發現損壞的是多個數據文件,即可以采用一個一個數據文件的恢復方法(第5步中需要對數據文件一一脫機,第6步中需要對數據文件分別恢復),也可以采用整個數據庫的恢復方法;
4、如果是系統表空間的損壞,不能采用此方法。
 
4.2.2 rman備份方案
rman也可以進行聯機備份,而且備份與恢復方法將比os備份更簡單可靠。
1、連接數據庫,創建測試表并插入記錄
sql> connect internal/password as sysdba;
connected.
 
sql> create table test(a int) tablespace users;
table created
sql> insert into test values(1);
1 row inserted
sql> commit;
commit complete
 
2、 備份數據庫表空間users
c:/>rman
recovery manager: release 8.1.6.0.0 - production
rman> connect rcvcat rman/[email protected]
rman-06008: connected to recovery catalog database
rman> connect target internal/virpure
rman-06005: connected to target database: test (dbid=1788174720)
 
rman> run{
2> allocate channel c1 type disk;
3> backup tag 'tsuser' format 'd:/backup/tsuser_%u_%s_%p'
4> tablespace users;
5> release channel c1;
6> }
 
rman-03022: compiling command: allocate
rman-03023: executing command: allocate
rman-08030: allocated channel: c1
rman-08500: channel c1: sid=16 devtype=disk
 
rman-03022: compiling command: backup
rman-03025: performing implicit partial resync of recovery catalog
rman-03023: executing command: partial resync
rman-08003: starting partial resync of recovery catalog
rman-08005: partial resync complete
rman-03023: executing command: backup
rman-08008: channel c1: starting full datafile backupset
rman-08502: set_count=5 set_stamp=494177612 creation_time=16-may-03
rman-08010: channel c1: specifying datafile(s) in backupset
rman-08522: input datafile fno=00003 name=d:/oracle/oradata/test/user01.dbf
rman-08013: channel c1: piece 1 created
rman-08503: piece handle=d:/backup/tsuser_05en93ac_5_1 comment=none
rman-08525: backup set complete, elapsed time: 00:00:01
rman-03023: executing command: partial resync
rman-08003: starting partial resync of recovery catalog
rman-08005: partial resync complete
rman-03022: compiling command: release
rman-03023: executing command: release
rman-08031: released channel: c1
rman>
 
3、 繼續在測試表中插入記錄
sql> insert into test values(2);
1 row inserted
sql> commit;
commit complete
sql> select * from test;
                         a
---------------------------------------
                         1
                         2
sql> alter system switch logfile;
system altered.
sql>r
1* alter system switch logfile;
system altered.
 
4、 關閉數據庫,模擬丟失數據文件
sql> shutdown immediate;
database closed.
database dismounted.
oracle instance shut down
 
c:/>del d:/oracle/oradata/test/user01.dbf
 
5、 啟動數據庫,檢查錯誤
sql> startup
oracle instance started.
total system global area  102020364 bytes
fixed size                    70924 bytes
variable size              85487616 bytes
database buffers           16384000 bytes
redo buffers                  77824 bytes
database mounted.
ora-01157: cannot identify/lock data file 3 - see dbwr trace file
ora-01110: data file 3: 'd:/oracle/oradata/test/user01.dbf'
 
6、 先打開數據庫
sql> alter database datafile 3 offline drop;
database altered.
sql> alter database open;
database altered.
 
7、 恢復該表空間
恢復腳本可以是恢復單個數據文件
run{
allocate channel c1 type disk;
restore datafile 3;
recover datafile 3;
sql 'alter database datafile 3 online';
release channel c1;
}
也可以是,恢復表空間
run{
allocate channel c1 type disk;
restore tablespace users;
recover tablespace users;
sql 'alter database datafile 3 online';
release channel c1;
}
過程如下:
c:/>rman
recovery manager: release 8.1.6.0.0 - production
rman> connect rcvcat rman/[email protected]
rman-06008: connected to recovery catalog database
rman> connect target internal/virpure
rman-06005: connected to target database: test (dbid=1788174720)
 
rman> run{
2> allocate channel c1 type disk;
3> restore datafile 3;
4> recover datafile 3;
5> sql 'alter database datafile 3 online';
6> release channel c1;
7> }
 
//輸出內容冗長,省略--編者
rman>
 
8、 檢查數據是否完整
sql> alter database open;
database altered.
 
sql> select * from test;
                         a
---------------------------------------
                         1
                         2
說明:
1、rman也可以實現單個表空間或數據文件的恢復,恢復過程可以在mount下或open方式下,如果在open方式下恢復,可以減少down機時間;
2、如果損壞的是一個數據文件,建議offline并在open方式下恢復;
3、這里可以看到,rman進行數據文件與表空間恢復的時候,代碼都比較簡單,而且能保證備份與恢復的可靠性,所以建議采用rman的備份與恢復.
 
4.3丟失多個數據文件,實現整個數據庫的恢復.
 
4.3.1 os備份方案
os備份歸檔模式下損壞(丟失)多個數據文件,進行整個數據庫的恢復
1、 連接數據庫,創建測試表并插入記錄
sql> connect internal/password as sysdba;
connected.
 
sql> create table test(a int);
table created
sql> insert into test values(1);
1 row inserted
sql> commit;
commit complete
 
2、 備份數據庫,備份除臨時數據文件后的所數據文件
sql> @hotbak.sql 或在dos下 svrmgrl @hotbak.sql
 
3、 繼續在測試表中插入記錄
sql> insert into test values(2);
1 row inserted
sql> commit;
commit complete
sql> select * from test;
                         a
---------------------------------------
                         1
                         2
sql> alter system switch logfile;
system altered.
sql> alter system switch logfile;
system altered.
 
4、 關閉數據庫,模擬丟失數據文件
sql> shutdown immediate;
database closed.
database dismounted.
oracle instance shut down
 
c:/>del d:/oracle/oradata/test ystem01.dbf
c:/>del d:/oracle/oradata/test/indx01.dbf
c:/>del d:/oracle/oradata/test/tools01.dbf
c:/>del d:/oracle/oradata/test/rbs01.dbf
模擬媒體毀壞(這里刪除多個數據文件)
 
5、 啟動數據庫,檢查錯誤
sql> startup
oracle instance started.
total system global area  102020364 bytes
fixed size                    70924 bytes
variable size              85487616 bytes
database buffers           16384000 bytes
redo buffers                  77824 bytes
database mounted.
ora-01157: cannot identify/lock data file 1 - see dbwr trace file
ora-01110: data file 1: 'd:/oracle/oradata/test ystem01.dbf'
 
詳細信息可以查看報警文件
ora-1157 signalled during: alter database open...
thu may 08 09:39:36 2003
errors in file d:/oracle/admin/test/bdump/testdbw0.trc:
ora-01157: cannot identify/lock data file 1 - see dbwr trace file
ora-01110: data file 1: 'd:/oracle/oradata/test ystem01.dbf'
ora-27041: unable to open file
osd-04002: unable to open file
o/s-error: (os 2) 系統找不到指定的文件。
 
thu may 08 09:39:36 2003
errors in file d:/oracle/admin/test/bdump/testdbw0.trc:
ora-01157: cannot identify/lock data file 2 - see dbwr trace file
ora-01110: data file 2: 'd:/oracle/oradata/test/rbs01.dbf'
ora-27041: unable to open file
osd-04002: unable to open file
o/s-error: (os 2) 系統找不到指定的文件。
 
thu may 08 09:39:36 2003
errors in file d:/oracle/admin/test/bdump/testdbw0.trc:
ora-01157: cannot identify/lock data file 5 - see dbwr trace file
ora-01110: data file 5: 'd:/oracle/oradata/test/tools01.dbf'
ora-27041: unable to open file
osd-04002: unable to open file
o/s-error: (os 2) 系統找不到指定的文件。
 
thu may 08 09:39:36 2003
errors in file d:/oracle/admin/test/bdump/testdbw0.trc:
ora-01157: cannot identify/lock data file 6 - see dbwr trace file
ora-01110: data file 6: 'd:/oracle/oradata/test/indx01.dbf'
ora-27041: unable to open file
osd-04002: unable to open file
o/s-error: (os 2) 系統找不到指定的文件。
 
通過查詢v$recover_file可以看到
sql> select * from v$recover_file;
 
     file# online  error                 change# time
---------- ------- ------------------ ---------- -----------
         1 online  file not found              0 
         2 online  file not found              0 
         5 online  file not found              0 
         6 online  file not found              0
有四個數據文件需要恢復
 
6、 拷貝備份回到原地點(restore),開始恢復數據庫(recover)
restore過程:
c:/>copy d:/databak ystem01.dbf d:/oracle/oradata/test/
c:/>copy d:/databak/test/indx01.dbf d:/oracle/oradata/test/
c:/>copy d:/databak/test/tools01.dbf d:/oracle/oradata/test/
c:/>copy d:/databak/test/rbs01.dbf.dbf d:/oracle/oradata/test/
 
recover過程:
sql> recover database;
 
ora-00279: change 1073849 generated at 05/08/2003 08:58:35 needed for thread 1
ora-00289: suggestion : d:/oracle/oradata/test/archive/testt001s00311.arc
ora-00280: change 1073849 for thread 1 is in sequence #311
 
specify log: {<ret>=suggested | filename | auto | cancel}
auto
ora-00279: change 1073856 generated at 05/08/2003 09:03:27 needed for thread 1
ora-00289: suggestion : d:/oracle/oradata/test/archive/testt001s00312.arc
ora-00280: change 1073856 for thread 1 is in sequence #312
ora-00278: log file 'd:/oracle/oradata/test/archive/testt001s00311.arc' no
longer needed for this recovery
 
ora-00279: change 1073858 generated at 05/08/2003 09:11:43 needed for thread 1
ora-00289: suggestion : d:/oracle/oradata/test/archive/testt001s00313.arc
ora-00280: change 1073858 for thread 1 is in sequence #313
ora-00278: log file 'd:/oracle/oradata/test/archive/testt001s00312.arc' no
longer needed for this recovery
 
ora-00279: change 1073870 generated at 05/08/2003 09:11:46 needed for thread 1
ora-00289: suggestion : d:/oracle/oradata/test/archive/testt001s00314.arc
ora-00280: change 1073870 for thread 1 is in sequence #314
ora-00278: log file 'd:/oracle/oradata/test/archive/testt001s00313.arc' no
longer needed for this recovery
 
log applied.
media recovery complete.
 
7、 打開數據庫,檢查數據庫的數據(完全恢復)
sql> alter database open;
database altered.
sql> select * from test;
                         a
---------------------------------------
                         1
                         2
 
說明:
1、只要有備份與歸檔存在,就可以實現數據庫的完全恢復(不丟失數據);
2、適合于丟失大量數據文件,或包含系統數據文件在內的數據庫的恢復;
3、恢復過程在mount下進行,如果恢復成功,再打開數據庫,down機時間可能比較長一些。
 
4.3.2 rman備份方案
rman備份歸檔模式下損壞(丟失)多個數據文件,進行整個數據庫的恢復
1、連接數據庫,創建測試表并插入記錄
 
sql> connect internal/password as sysdba;
connected.
sql> create table test(a int);
table created
sql> insert into test values(1);
1 row inserted
sql> commit;
commit complete
 
2、備份數據庫
dos下 c:>/ rman cmdfile=bakup.rcv msglog=backup.log;
 
以下是backup.log內容。
recovery manager: release 8.1.6.0.0 - production
rman> #     script:bakup.rcv
2> #     creater:chenjiping
3> #     date:5.8.2003
4> #     desc:backup all database datafile in archive with rman
5> 
6> #connect database
7> connect rcvcat rman/[email protected];
8> connect target internal/virpure;
9> 
10> #start backup database
11> run{
12> allocate channel c1 type disk;
13> backup full tag 'dbfull' format 'd:/backup/full%u_%s_%p' database
14> include current controlfile;
15> sql 'alter system archive log current';
16> release channel c1;
17> }
18> #end
19> 
 
rman-06008: connected to recovery catalog database
rman-06005: connected to target database: test (dbid=1788174720)
rman-03022: compiling command: allocate
rman-03023: executing command: allocate
rman-08030: allocated channel: c1
rman-08500: channel c1: sid=15 devtype=disk
rman-03022: compiling command: backup
rman-03023: executing command: backup
rman-08008: channel c1: starting full datafile backupset
rman-08502: set_count=4 set_stamp=494074368 creation_time=15-may-03
rman-08010: channel c1: specifying datafile(s) in backupset
rman-08522: input datafile fno=00002 name=d:/oracle/oradata/test/rbs01.dbf
rman-08522: input datafile fno=00001 name=d:/oracle/oradata/test ystem01.dbf
rman-08011: including current controlfile in backupset
rman-08522: input datafile fno=00005 name=d:/oracle/oradata/test/tools01.dbf
rman-08522: input datafile fno=00004 name=d:/oracle/oradata/test/temp01.dbf
rman-08522: input datafile fno=00006 name=d:/oracle/oradata/test/indx01.dbf
rman-08522: input datafile fno=00003 name=d:/oracle/oradata/test/user01.dbf
rman-08013: channel c1: piece 1 created
rman-08503: piece handle=d:/backup/full04en5ug0_4_1 comment=none
rman-08525: backup set complete, elapsed time: 00:01:16
rman-03023: executing command: partial resync
rman-08003: starting partial resync of recovery catalog
rman-08005: partial resync complete
rman-03022: compiling command: sql
rman-06162: sql statement: alter system archive log current
rman-03023: executing command: sql
rman-03022: compiling command: release
rman-03023: executing command: release
rman-08031: released channel: c1
recovery manager complete.
到這里表示備份成功。
 
3、 繼續在測試表中插入記錄
sql> insert into test values(2);
1 row inserted
sql> commit;
commit complete
sql> select * from test;
                         a
---------------------------------------
                         1
                         2
sql>alter system switch logfile;
system altered.
sql> alter system switch logfile;
system altered.
 
4、 關閉數據庫,模擬丟失數據文件
sql> shutdown immediate;
database closed.
database dismounted.
oracle instance shut down
c:/>del d:/oracle/oradata/test ystem01.dbf
c:/>del d:/oracle/oradata/test/indx01.dbf
c:/>del d:/oracle/oradata/test/tools01.dbf
c:/>del d:/oracle/oradata/test/rbs01.dbf
 
5、啟動數據庫,檢查錯誤
sql> startup
oracle instance started.
total system global area  102020364 bytes
fixed size                    70924 bytes
variable size              85487616 bytes
database buffers           16384000 bytes
redo buffers                  77824 bytes
database mounted.
ora-01157: cannot identify/lock data file 1 - see dbwr trace file
ora-01110: data file 1: 'd:/oracle/oradata/test ystem01.dbf'
 
查詢v$recover_file
sql> select * from v$recover_file;
 
     file# online  error                 change# time
---------- ------- ------------------ ---------- -----------
         1 online  file not found              0 
         2 online  file not found              0 
         5 online  file not found              0 
         6 online  file not found              0
可以知道有四個數據文件需要恢復.
 
6、利用rman進行恢復
c:/>rman
recovery manager: release 8.1.6.0.0 - production
rman> connect rcvcat rman/[email protected]
rman-06008: connected to recovery catalog database
rman> connect target internal/virpure
rman-06005: connected to target database: test (dbid=1788174720)
rman> run{
2> allocate channel c1 type disk;
3> restore database;
4> recover database;
5> sql 'alter database open';
6> release channel c1;
7> }
 
rman-03022: compiling command: allocate
rman-03023: executing command: allocate
rman-08030: allocated channel: c1
rman-08500: channel c1: sid=17 devtype=disk
rman-03022: compiling command: restore
rman-03025: performing implicit partial resync of recovery catalog
rman-03023: executing command: partial resync
rman-08003: starting partial resync of recovery catalog
rman-08005: partial resync complete
rman-03022: compiling command: irestore
rman-03023: executing command: irestore
rman-08016: channel c1: starting datafile backupset restore
rman-08502: set_count=4 set_stamp=494074368 creation_time=15-may-03
rman-08089: channel c1: specifying datafile(s) to restore from backup set
rman-08523: restoring datafile 00001 to d:/oracle/oradata/test ystem01.dbf
rman-08523: restoring datafile 00002 to d:/oracle/oradata/test/rbs01.dbf
rman-08523: restoring datafile 00003 to d:/oracle/oradata/test/user01.dbf
rman-08523: restoring datafile 00004 to d:/oracle/oradata/test/temp01.dbf
rman-08523: restoring datafile 00005 to d:/oracle/oradata/test/tools01.dbf
rman-08523: restoring datafile 00006 to d:/oracle/oradata/test/indx01.dbf
rman-08023: channel c1: restored backup piece 1
rman-08511: piece handle=d:/backup/full04en5ug0_4_1 tag=dbfull params=null
rman-08024: channel c1: restore complete
rman-03023: executing command: partial resync
rman-08003: starting partial resync of recovery catalog
rman-08005: partial resync complete
rman-03022: compiling command: recover
rman-03022: compiling command: recover(1)
rman-03022: compiling command: recover(2)
rman-03022: compiling command: recover(3)
rman-03023: executing command: recover(3)
rman-08054: starting media recovery
rman-03022: compiling command: recover(4)
rman-06050: archivelog thread 1 sequence 327 is already on disk as file d:/oracle/oradata/test/archive/testt001s00327.arc
rman-06050: archivelog thread 1 sequence 328 is already on disk as file d:/oracle/oradata/test/archive/testt001s00328.arc
rman-06050: archivelog thread 1 sequence 329 is already on disk as file d:/oracle/oradata/test/archive/testt001s00329.arc
rman-06050: archivelog thread 1 sequence 330 is already on disk as file d:/oracle/oradata/test/archive/testt001s00330.arc
rman-03023: executing command: recover(4)
rman-08515: archivelog filename=d:/oracle/oradata/test/archive/testt001s00327.arc thread=1 sequence=327
rman-08515: archivelog filename=d:/oracle/oradata/test/archive/testt001s00328.arc thread=1 sequence=328
rman-08055: media recovery complete
rman-03022: compiling command: sql
rman-06162: sql statement: alter database open
rman-03023: executing command: sql
rman-03022: compiling command: release
rman-03023: executing command: release
rman-08031: released channel: c1
rman>
 
7、 檢查數據庫的數據(完全恢復)
sql> select * from test;
                         a
---------------------------------------
                         1
                         2
 
說明:
1、只要有備份與歸檔存在,rman也可以實現數據庫的完全恢復(不丟失數據);
2、同os備份數據庫恢復,適合于丟失大量數據文件,或包含系統數據文件在內的數據庫的恢復;
3、目標數據庫在mount下進行,如果恢復成功,再打開數據庫;
4、rman的備份與恢復命令相對比較簡單并可靠,建議有條件的話,都采用rman進行數據庫的備份。
 
4.4 不完全恢復案例
 
4.4.1 os備份下的基于時間的恢復
 
不完全恢復可以分為基于時間的恢復,基于改變的恢復與基于撤消的恢復,這里已基于時間的恢復為例子來說明不完全恢復過程。
 
基于時間的恢復可以不完全恢復到現在時間之前的某一個時間,對于某些誤操作,如刪除了一個數據表,可以在備用恢復環境上恢復到表的刪除時間之前,然后把該表導出到正式環境,避免一個人為的錯誤。
 
1、 連接數據庫,創建測試表并插入記錄:
sql> connect internal/password as sysdba;
connected.
sql> create table test(a int);
table created
sql> insert into test values(1);
1 row inserted
sql> commit;
commit complete
 
2、 備份數據庫,這里最好備份所有的數據文件,包括臨時數據文件:
sql> @hotbak.sql 或在dos下 svrmgrl @hotbak.sql
或冷備份也可以
 
3、 刪除測試表,假定刪除前的時間為t1,在刪除之前,便于測試,繼續插入數據并應用到歸  
檔。
sql> insert into test values(2);
1 row inserted
sql> commit;
commit complete
sql> select * from test;
                         a
---------------------------------------
                         1
                         2
sql> alter system switch logfile;
statement processed.
sql> alter system switch logfile;
statement processed.
 
sql> select to_char(sysdate,'yyyy-mm-dd hh24:mi:ss') from dual;
to_char(sysdate,'yy
-------------------
2003-05-21 14:43:01
sql> drop table test;
table dropped.
 
4、 準備恢復到時間點t1,找回刪除的表,先關閉數據庫:
sql> shutdown immediate;
database closed.
database dismounted.
oracle instance shut down.
 
5、 拷貝剛才備份的所有數據文件回來
c:/>copy d:/databak/*.dbf d:/oracle/oradata/test/
 
6、 啟動到mount下
sql> startup mount;
oracle instance started.
total system global area  102020364 bytes
fixed size                    70924 bytes
variable size              85487616 bytes
database buffers           16384000 bytes
redo buffers                  77824 bytes
database mounted.
 
7、 開始不完全恢復數據庫到t1時間
sql> recover database until time '2003-05-21:14:43:01';
ora-00279: change 30944 generated at 05/21/2003 14:40:06 needed for thread 1
ora-00289: suggestion : d:/oracle/oradata/test/archive/testt001s00191.arc
ora-00280: change 30944 for thread 1 is in sequence #191
 
specify log: {<ret>=suggested | filename | auto | cancel}
auto
log applied.
media recovery complete.
8、 打開數據庫,檢查數據
sql> alter database open resetlogs;
 
database altered.
sql> select * from test;
                         a
---------------------------------------
                         1
                         2
 
說明:
1、不完全恢復最好備份所有的數據,冷備份亦可,因為恢復過程是從備份點往后恢復的,如果因為其中一個數據文件的時間戳(scn)大于要恢復的時間點,那么恢復都是不可能成功的;
2、不完全恢復有三種方式,過程都一樣,僅僅是recover命令有所不一樣,這里用基于時間的恢復作為示例;
3、不完全恢復之后,都必須用resetlogs的方式打開數據庫,建議馬上再做一次全備份,因為resetlogs之后再用以前的備份恢復是很難了;
4、以上是在刪除之前獲得時間,但是實際應用中,很難知道刪除之前的實際時間,但可以采用大致時間即可,或可以采用分析日志文件(logmnr),取得精確的需要恢復的時間;
5、一般都是在測試機后備用機器上采用這種不完全恢復,恢復之后導出/導入被誤刪的表回生產系統.
 
4.4.2 rman備份下的基于改變的恢復
以上用os備份說明了一個基于時間的恢復,現在用rman說明一個基于改變的恢復
 
1、 連接數據庫,創建測試表并插入記錄
 
sql> connect internal/password as sysdba;
connected.
sql> create table test(a int);
table created
sql> insert into test values(1);
1 row inserted
sql> commit;
commit complete
 
2、 備份數據庫
c:/>rman
recovery manager: release 8.1.6.0.0 - production
rman> connect rcvcat rman/[email protected]
rman-06008: connected to recovery catalog database
rman> connect target internal/virpure
rman-06005: connected to target database: test (dbid=874705288)
 
rman> run{
2> allocate channel c1 type disk;
3> backup full tag 'dbfull' format 'd:/backup/full%u_%s_%p' database
4> include current controlfile;
5> sql 'alter system archive log current';
6> release channel c1;
7> }
 
    //屏幕輸出內容冗長,省略--編輯
rman>
 
3、 刪除測試表,在刪除之前,便于測試,繼續插入數據并應用到歸檔,并獲取刪除前的scn號。
sql> insert into test values(2);
1 row inserted
sql> commit;
commit complete
sql> select * from test;
                         a
---------------------------------------
                         1
                         2
sql> alter system switch logfile;
statement processed.
sql> alter system switch logfile;
statement processed.
 
sql> select max(ktuxescnw * power(2, 32) + ktuxescnb) scn from x$ktuxe;
      scn
----------
  31014
sql> drop table test;
table dropped.
 
4、 準備恢復到scn 31014,先關閉數據庫,然后啟動到mount下
sql> shutdown immediate;
database closed.
database dismounted.
oracle instance shut down.
sql> startup mount;
 
5、 開始恢復到改變點scn 31014
rman> run{
2>      allocate channel c1 type disk;
3>      restore database;
4>      recover database until scn 31014;
5>      sql 'alter database open resetlogs';
6>      release channel c1;
7> }
 
rman-03022: compiling command: allocate
rman-03023: executing command: allocate
rman-08030: allocated channel: c1
rman-08500: channel c1: sid=10 devtype=disk
rman-03022: compiling command: restore
rman-03022: compiling command: irestore
rman-03023: executing command: irestore
rman-08016: channel c1: starting datafile backupset restore
rman-08502: set_count=1 set_stamp=494613682 creation_time=21-may-03
rman-08089: channel c1: specifying datafile(s) to restore from backup set
rman-08523: restoring datafile 00001 to d:/oracle/oradata/test ystem01.dbf
rman-08523: restoring datafile 00002 to d:/oracle/oradata/test/rbs01.dbf
rman-08523: restoring datafile 00003 to d:/oracle/oradata/test/users01.dbf
rman-08523: restoring datafile 00004 to d:/oracle/oradata/test/temp01.dbf
rman-08523: restoring datafile 00005 to d:/oracle/oradata/test/tools01.dbf
rman-08523: restoring datafile 00006 to d:/oracle/oradata/test/indx01.dbf
rman-08023: channel c1: restored backup piece 1
rman-08511: piece handle=d:/backup/full01enmd5i_1_1 tag=dbfull params=null
rman-08024: channel c1: restore complete
rman-03023: executing command: partial resync
rman-08003: starting partial resync of recovery catalog
rman-08005: partial resync complete
rman-03022: compiling command: recover
rman-03022: compiling command: recover(1)
rman-03022: compiling command: recover(2)
rman-03022: compiling command: recover(3)
rman-03023: executing command: recover(3)
rman-08054: starting media recovery
rman-03022: compiling command: recover(4)
rman-06050: archivelog thread 1 sequence 191 is already on disk as file d:/oracl
e/oradata/test/archive/testt001s00191.arc
rman-06050: archivelog thread 1 sequence 192 is already on disk as file d:/oracl
e/oradata/test/archive/testt001s00192.arc
rman-03023: executing command: recover(4)
rman-08515: archivelog filename=d:/oracle/oradata/test/archive/testt001s00191.ar
c thread=1 sequence=191
rman-08515:archivelog filename=d:/oracle/oradata/test/archive/testt001s00192.arc 
thread=1 sequence=192
rman-08055: media recovery complete
rman-03022: compiling command: sql
rman-06162: sql statement: alter database open resetlogs
rman-03023: executing command: sql
rman-03022: compiling command: release
rman-03023: executing command: release
rman-08031: released channel: c1
 
6、 檢查數據
database altered.
sql> select * from test;
                         a
---------------------------------------
                         1
                         2
可以看到,表依然存在。
 
說明:
1、 rman也可以實現不完全恢復,方法比os備份恢復的方法更簡單可靠;
2、 rman可以基于時間,基于改變與基于日志序列的不完全恢復,基于日志序列的恢復可以指定恢復到哪個日志序列,如
run {  
        allocate channel ch1 type disk;  
        allocate channel ch2 type 'sbt_tape'; 
        set until logseq 1234 thread 1; 
        restore controlfile to '$oracle_home/dbs/cf1.f' ;  
        replicate controlfile from '$oracle_home/dbs/cf1.f'; 
        alter database mount;  
        restore database;  
        recover database;  
        sql "alter database open resetlogs";
}
3、 與所有的不完全恢復一樣,必須在mount下,restore所有備份數據文件,需要resetlogs;
4、 基于改變的恢復比基于時間的恢復更可靠,但是可能也更復雜,需要知道需要恢復到哪一個改變號(scn),在正常生產中,獲取scn的辦法其實也有很多,如查詢數據庫字典表(v$archived_log or v$log_history),或分析歸檔與聯機日志(logmnr)等。
第五章 其它恢復案例
5.1 損壞聯機日志的恢復方法
5.1.1 損壞非當前聯機日志
大家都清楚,聯機日志分為當前聯機日志和非當前聯機日志,非當前聯機日志的損壞是比較簡單的,一般通過clear命令就可以解決問題。
1、啟動數據庫,遇到ora-00312 or ora-00313錯誤,如
ora-00313: open failed for members of log group 1 of thread 1
ora-00312: online log 1 thread 1: 'd:/oracle/oradata/test/redo01.log'
從這里我們知道日志組1的數據文件損壞了
從報警文件可以看到更詳細的信息
2、 查看v$log視圖
sql> select group#,sequence#,archived,status from v$log;
 
    group#      sequence# archived status
---------- ---------- -------- ----------------
         1          1     yes      inactive
         2          2     yes      inactive
         3          3     no       current
可以知道,該組是非當前狀態,而且已經歸檔。
3、 用clear命令重建該日志文件
sql>alter database clear logfile group 1;
如果是該日志組還沒有歸檔,則需要用
sql>alter database clear unarchived logfile group 1;
4、 打開數據庫,重新備份數據庫
sql>alter database open;
 
說明:
1、如果損壞的是非當前的聯機日志文件,一般只需要clear就可以重建該日志文件,但是如果該數據庫處于歸檔狀態但該日志還沒有歸檔,就需要強行clear;
2、建議clear,特別是強行clear后作一次數據庫的全備份;
3、此方法適用于歸檔與非歸檔數據庫。
 
5.1.2 損壞當前聯機日志
 
歸檔模式下當前日志的損壞有兩種情況,
一、是數據庫是正常關閉,日志文件中沒有未決的事務需要實例恢復,當前日志組的損 壞就可以直接用alter database clear unarchived logfile group n來重建。
二、是日志組中有活動的事務,數據庫需要媒體恢復,日志組需要用來同步,有兩種補救辦法:
a.  最好的辦法就是通過不完全恢復,可以保證數據庫的一致性,但是這種辦法要求在歸檔方式下,并且有可用的備份
b.  通過強制性恢復,但是可能導致數據庫不一致。
下面分別用來說明這兩種恢復方法:
 
5.1.2.1 通過備份來恢復
1、 打開數據庫,會遇到一個類似的錯誤
ora-00313: open failed for members of log group 1 of thread 1
ora-00312: online log 1 thread 1: 'd:/oracle/oradata/test/redo01.log'
ora-27041: unable to open file
osd-04002: unable to open file
o/s-error: (os 2) 系統找不到指定的文件
 
2、 查看v$log,發現是當前日志
sql> select group#,sequence#,archived,status from v$log;
 
    group#      sequence# archived status
--------- ---------- -------- ----------------
         1          1     no       current
         2          2     yes      inactive
         3          3     yes      inactive
 
3、 發現clear不成功
sql> alter database clear unarchived logfile group 1;
alter database clear unarchived logfile group 1
*
error at line 1:
ora-01624: log 1 needed for crash recovery of thread 1
ora-00312: online log 1 thread 1: 'd:/oracle/oradata/test/redo01.log'
 
4、 拷貝有效的數據庫的全備份,并不完全恢復數據庫:
可以采用獲取最近的scn的辦法用until scn恢復或用until cnacel恢復
recover database until cancel
先選擇auto,盡量恢復可以利用的歸檔日志,然后重新
recover database until cancel
這次輸入cancel,完成不完全恢復,也就是說恢復兩次。
如:
sql> recover database until cancel;
auto
……
sql> recover database until cancel;
cancel;
5、 利用alter database open resetlogs打開數據庫.
 
說明:
  1、這種辦法恢復的數據庫是一致的不完全恢復,會丟失當前聯機日志中的事務數據;
  2、這種方法適合于歸檔數據庫并且有可用的數據庫全備份;
  3、恢復成功之后,記得再做一次數據庫的全備份;
  4、建議聯機日志文件一定要實現鏡相在不同的磁盤上,避免這種情況的發生,因為任何數據的丟失對于生產來說都是不容許的。
 
5.1.2.2 如果沒有備份,進行強制性恢復
1、 打開數據庫,會遇到一個類似的錯誤
ora-00313: open failed for members of log group 1 of thread 1
ora-00312: online log 1 thread 1: 'd:/oracle/oradata/test/redo01.log'
ora-27041: unable to open file
osd-04002: unable to open file
o/s-error: (os 2) 系統找不到指定的文件
 
2、 查看v$log,發現是當前日志
sql> select group#,sequence#,archived,status from v$log;
 
    group#  sequence# archived status
---------- ---------- -------- ----------------
         1          1 no       current
         2          2 yes      inactive
         3          3 yes      inactive
 
3、 發現clear不成功
sql> alter database clear unarchived logfile group 1;
alter database clear unarchived logfile group 1
*
error at line 1:
ora-01624: log 1 needed for crash recovery of thread 1
ora-00312: online log 1 thread 1: 'd:/oracle/oradata/test/redo01.log'
 
4、 把數據庫down掉
    sql>shutdown immediate
 
5、 在init<sid>.ora中加入如下參數
     _allow_resetlogs_corruption=true
 
6、 重新啟動數據庫,利用until cancel恢復
    sql>recover database until cancel; 
    cancel
如果出錯,不再理會,發出 
sql>alter database open resetlogs;
 
7、 數據庫被打開后,馬上執行一個full export
 
8、 shutdown數據庫,去掉_all_resetlogs_corrupt參數 
 
9、 重建庫
 
10、import并完成恢復
 
11、建議執行一下analyze table ...validate structure cascade;
說明:
1、該恢復方法是沒有辦法之后的恢復方法,一般情況下建議不要采用,因為該方法可能導致數據庫的不一致;
2、該方法也丟失數據,但是丟失的數據沒有上一種方法的數據多,主要是未寫入數據文件的已提交或未提交數據;
3、建議成功后嚴格執行以上的7到11步,完成數據庫的檢查與分析;
4、全部完成后做一次數據庫的全備份;
5、建議聯機日志文件一定要實現鏡相在不同的磁盤上,避免這種情況的發生,因為任何數據的丟失對于生產來說都是不容許的。
5.2 損壞控制文件的恢復方法
 
5.2.1 損壞單個控制文件
損壞單個控制文件是比較容易恢復的,因為一般的數據庫系統,控制文件都不是一個,而且所有的控制文件都互為鏡相,只要拷貝一個好的控制文件替換壞的控制文件就可以了。
 
1、 控制文件損壞,最典型的就是啟動數據庫出錯,不能mount數據庫
sql>startup
ora-00205: error in identifying controlfile, check alert log for more info
查看報警日志文件,有如下信息
alter database  mount
mon may 26 11:59:52 2003
ora-00202: controlfile: 'd:/oracle/oradata/chen/control01.ctl'
ora-27041: unable to open file
osd-04002: unable to open file
o/s-error: (os 2) 系統找不到指定的文件。
 
2、 停止數據庫:
sql>shutdown immediate
 
3、 拷貝一個好的控制文件替換壞的控制文件或修改init.ora中的控制文件參數,取消這個壞的控制文件。
 
4、 重新啟動數據:
sql>startup
 
說明:
1、損失單個控制文件是比較簡單的,因為數據庫中所有的控制文件都是鏡相的,只需要簡單的
拷貝一個好的就可以了;
2、建議鏡相控制文件在不同的磁盤上;
3、建議多做控制文件的備份,長期保留一份由alter database backup control file to trace產生的控制文件的文本備份。
5.2.2 損壞全部控制文件
 
損壞多個控制文件,或者人為的刪除了所有的控制文件,通過控制文件的復制已經不能解決問題,這個時候需要重新建立控制文件。
 
同時注意,alter database backup control file to trace可以產生一個控制文件的文本備份。
以下是詳細重新創建控制文件的步驟:
1、 關閉數據庫
sql>shutdown immediate;
2、 刪除所有控制文件,模擬控制文件的丟失
 
3、 啟動數據庫,出現錯誤,并不能啟動到mount下
sql>startup
ora-00205: error in identifying controlfile, check alert log for more info
查看報警日志文件,有如下信息
alter database  mount
mon may 26 11:53:15 2003
ora-00202: controlfile: 'd:/oracle/oradata/chen/control01.ctl'
ora-27041: unable to open file
osd-04002: unable to open file
o/s-error: (os 2) 系統找不到指定的文件。
 
4、 關閉數據庫
sql>shutdown immediate;
 
5、 在internal或sys下運行如下創建控制文件的腳本,注意完整列出聯機日志或數據文件的路徑,或修改由alter database backup control file to trace備份控制文件時產生的腳本,去掉多余的注釋即可。
startup nomount
create controlfile reuse database "test" noresetlogs noarchivelog
         maxlogfiles 32
         maxlogmembers 2
         maxdatafiles 254
         maxinstances 1
         maxloghistory 226
logfile
    group 1 'd:/oracle/oradata/test/redo01.log'  size 1m,
    group 2 'd:/oracle/oradata/test/redo02.log'  size 1m,
    group 3 'd:/oracle/oradata/test/redo03.log'  size 1m
datafile
    'd:/oracle/oradata/test ystem01.dbf',
    'd:/oracle/oradata/test/rbs01.dbf',
    'd:/oracle/oradata/test/users01.dbf',
    'd:/oracle/oradata/test/temp01.dbf',
    'd:/oracle/oradata/test/tools01.dbf',
    'd:/oracle/oradata/test/indx01.dbf'
character set zhs16gbk;
 
-- recovery is required if any of the datafiles are restored backups,
-- or if the last shutdown was not normal or immediate.
recover database
--if the last shutdown was not normal or immediate
--noarchive
-- recover database until cancelusing backup controlfile
--archive
-- recover database using backup controlfile until cancel
-- database can now be opened normally.
alter database open;
--if recover database until cancel
--alter database open resetlogs;
6、 如果沒有錯誤,數據庫將啟動到open狀態下。
 
說明:
1、重建控制文件用于恢復全部數據文件的損壞,需要注意其書寫的正確性,保證包含了所有的數據文件與聯機日志;
2、經常有這樣一種情況,因為一個磁盤損壞,我們不能再恢復(store)數據文件到這個磁盤,因此在store到另外一個盤的時候,我們就必須重新創建控制文件,用于識別這個新的數據文件,這里也可以用這種方法用于恢復。
 
5.3 損壞回滾數據文件的恢復方法
回滾段表空間中的一個數據文件丟失或者損壞導致數據庫無法識別它,在啟動數據庫的時候會出現ora-1157, ora-1110的錯誤,或者操作系統級別的錯誤,例如ora-7360。在關閉數據庫的時候(normal或者immediate)會出現ora-1116, ora-1110的錯誤,或者操作系統級別的錯誤,例如ora-7368。
 
感謝coolyl的辛勤工作,關于回滾段的大部分內容都是摘自他在itpub的文章。
 
5.3.1 損壞數據文件,但數據庫處于open狀態
如果你發現有回滾段的數據文件丟失或者損壞了,而此時的數據庫是處于打開的狀態下并且在運行,就千萬不要關閉數據庫了,因為在大多數的情況下打開的時候比關閉的時候好解決問題一些。
 
一般也是存在有兩種情況: 
a、是offline丟失或損壞的數據文件,然后從一個備份中恢復,執行介質恢復以保持一致性。但是這種情況要求數據庫是歸檔方式下才可以采用的。 
b、是offline那個存在丟失或損壞的數據文件所在的整個回滾段表空間,然后刪除整個回滾段表空間并重建,但是你必須要殺掉那些在回滾段中已經激活的用戶進程才可以offline的。 
通常第一種情況就比較簡單實現,但是更多的用戶事務將會出錯并且回滾。 
 
a的具體步驟: 
1、 offline丟失或損壞的數據文件 
alter database datafile '<full_path_file_name>' offline; 
2、 從一個有效的備份中恢復。 
3、 執行以下查詢:
select v1.group#, member, sequence# 
from v$log v1, v$logfile v2 
where v1.group# = v2.group# ; 
這個將列出你的所有redolog文件以及它們所代表的sequence numbers。 
4、 恢復數據文件。 
recover datafile '<full_path_file_name>' 
5、 確信你應用了所有的redolog文件,直至出現提示信息"media recovery complete"。 
6、 online那個數據文件。 
alter database datafile '<full_path_file_name>' online;
 
b的具體步驟: 
1、 offline存在丟失或損壞的數據文件的回滾段表空間中的所有回滾段。 
alter rollback segment <rollback_segment> offline; 
2、 檢測當然回滾段的狀態。 
select segment_name, status from dba_rollback_segs 
where tablespace_name = '<tablespace_name>'; 
3、 刪除所有offline的回滾段 
drop rollback segment <rollback_segment>; 
4、 處理那些online狀態的回滾段。 
重新執行第二步的查詢 
如果你已經執行過offline操作的回滾段狀態仍然是online,則說明這個回滾段內有活動的事務。你要接著查詢 
select segment_name, xacts active_tx, v.status 
from v$rollstat v, dba_rollback_segs 
where tablespace_name = '<tablespace_name>' and segment_id = usn; 
如果沒有返回結果,則證明存在丟失或損壞的數據文件的回滾段表空間中的所有回滾段都已經被offline了,然后重新執行第二步,第三步。如果查詢有結果返回,則狀態應該是"pending offline".接著查看active_tx列,如果值為0,則表明此回滾段中已經沒有未處理的事務了,很快就會被offline的,然后等它offline后重新執行2,3步后跳至第六步。如果值大于0,則繼續到第五步。 
5、 強制那些包含活動事務的回滾段offline。 
活動的事務應該被提交或者回滾,執行下面的查詢看看哪些用戶占用了回滾段: 
select s.sid, s.serial#, s.username, r.name "rollback" 
from v$session s, v$transaction t, v$rollname r 
where r.name in ('<pending_rollback_1>', ... , 
'<pending_rollback_n>') 
and s.taddr = t.addr and t.xidusn = r.usn; 
最好能直接聯系到那些user讓他們自己去回滾或者提交事務,如果不能做到的話,那就只能強制性的殺掉進程了。 
alter system kill session '<sid>, <serial#>'; 
殺掉進程后再過一段時間后回滾段會自動清除那些事務,然后就可以回到第二步繼續查詢了。 
6、 刪除回滾段。 
drop tablespace <tablespace_name> including contents; 
7、 重建回滾段并online它們。
 
說明:
1、數據庫如果是open狀態,就可以直接在open狀態下解決問題,沒有必要停下數據庫,增加down機時間;
2、不管上上面那種恢復方法都是正常性的恢復,不會引起數據的不一致或錯誤。
 
5.3.2數據庫關閉,但是數據文件中沒有活動事務
 
這種情況下最簡單的方法就是offline drop掉這個壞了的或者丟失的數據文件,然后以restricted模式打開數據庫然后刪除并且重建包含損壞文件的回滾段表空間。 
 
具體步驟如下: 
1、 確定數據庫是正常的關閉的。方法是可以去查看alert文件,到最后看是否有如下信息: 
"alter database dismount 
completed: alter database dismount" 
如果有的話,就證明數據庫是正常關閉的,否則就不能用這個方法去恢復。 
2、 修改init參數文件,移去rollback_segments中包含的損壞數據文件的回滾段表空間的回滾段,如果你不能確定哪些回滾段是壞的,簡單的方法是你可以注釋掉整個rollback_segments。 
3、 以restricted模式去mount數據庫。 
startup restrict mount 
4、 offline drop掉那個壞的數據文件 
alter database datafile '<full_path_file_name>' offline drop; 
5、 打開數據庫 
alter database open 
如果你看到如下信息"statement processed",則跳到第7步,如果你看到ora-604, ora-376, and ora-1110的錯誤信息,繼續第6步。 
6、    正常的關閉數據庫,然后在init文件中注釋掉rollback_segments,并加入隱含參數
_corrupted_rollback_segments = ( <rollback1>,...., <rollbackn> ) 
然后以restricted模式打開數據庫 
startup restrict 
7、 刪除掉那個包含損壞文件的回滾段表空間。 
drop tablespace <tablespace_name> including contents; 
8、 重建回滾段表空間,記得創建后要把回滾段都online。 
9、 重新使數據庫對所有用戶可用。 
alter system disable restricted session; 
10、然后正常關閉數據庫,修改init文件,如果開始只是注釋掉了rollback_segments的,就去掉注釋即可,如果加了隱含參數的,注釋掉它,并在rollback_segments加入所有的回滾段。 
11、正常啟動數據庫:
startup
說明:
1、這種方法的前提條件是數據庫是正常關閉(不是abort)可用;
2、這種方法是正常方法,不會引起數據錯誤。
 
5.3.3 數據庫關閉,數據文件中有活動事務,沒有可用備份。
一般造成這種原因的情況是采用了shutdown abort或其它原因異常關機(如斷電)導致的。
 
1、開啟一個事務 
sql> set transaction use rollback segment rbs0; 
transaction set.
sql> insert into test (a) values (1); 
1 row created.
 
2、異常關閉 
sql> shutdown abort;
oracle instance shut down.
 
3、刪除rbs的一個數據文件
c:>del d:/oracle/oradata/chen/rbs01.
 
4、修改init<sid>.ora :
rollback_segments=(system) 
添加_corrupted_rollback_segments=(rbs0,rbs1,rbs2……) 
 
5、sql>startup mount 
 
6、sql>alter database datafile 'd:/oracle/oradata/t8i/rbs01.dbf' offline drop; 
數據庫已更改。 
 
7、sql>recover database ; 
完成介質恢復。 
 
8、sql>alter database open ; 
數據庫已更改。 
 
9、sql>select * from v$rollname; 
 
         usn    name 
----   ------- 
         0       system 
 
10、sql>select segment_name,tablespace_name,status 
from dba_rollback_segs; 
segment_name tablespace_name      status 
----------- ------ ------------------------------------ 
system        system               online 
rbs0          rbs                  needs recovery 
rbs1          rbs                   needs recovery 
rbs2          rbs                  needs recovery 
 
11、sql>drop rollback segment rbs0; 
重算段已丟棄。 
    sql>drop rollback segment rbs1; 
重算段已丟棄。 
    sql>drop rollback segment rbs2; 
重算段已丟棄。
 
12、sql>select segment_name,tablespace_name,status 
from dba_rollback_segs; 
segment_name tablespace_name   status 
------------------------------------- 
system        system            online 
 
13、sql>drop tablespace rbs including contents; 
表空間已丟棄。 
 
14、重建新的回滾表空間及回滾段,并聯機。 
 
15、sql>shutdown abort 
 
16、再修改init<sid>.ora :
rollback_segments=(rbs0,rbs1,rbs2) 
將_corrupted_rollback_segments=(rbs0,rbs1,rbs2)去掉。 
 
17、sql>startup 
 
說明:
1、這種辦法是萬不得以的時候使用的方法,如果有備份,都建議從備份上進行恢復;
2、這種方法恢復的數據庫,可能會引起數據庫的數據錯誤;
3、恢復成功以后,建議exp/imp數據,并重新分析檢查數據庫。
5.3.4 數據庫關閉,數據文件中有活動事務,從備份恢復
1、從一個有效的備份中恢復損壞的數據文件。 
2、mount數據庫。 
3、執行以下查詢: 
select file#, name, status from v$datafile; 
如果發現要恢復的文件是offline狀態的話,要先online它: 
alter database datafile '<full_path_file_name>' online; 
4、執行以下查詢 
select v1.group#, member, sequence#, first_change# 
from v$log v1, v$logfile v2 
where v1.group# = v2.group# ; 
這個將列出redlog文件所代表的sequence和first change numbers。 
 
5、如果數據庫是非歸檔情況下,執行以下查詢: 
select file#, change# from v$recover_file; 
如果change#大于最小的redolog文件的first_change#,則數據文件可以被恢復,記得在應用日志的時候要把所有redolog文件全部應用一遍。 
如果change#小于最小的redolog文件的first_change#,則數據文件就不可以被恢復了,這時候你要從一個有效的全備份中去恢復數據庫了,如果沒有全備份的話,那你就只能把數據庫強制打開到一個不一致的狀態去exp出數據,然后重新建庫導入數據,因為這種方式的恢復oracle是不推薦用戶自己做的,所以這里我就不詳細說明了。
 
6、恢復數據文件: 
recover datafile '<full_path_file_name>' 
7、確信你應用了所有的redolog文件,直至出現提示信息"media recovery complete"。 
8、打開數據庫。
說明:
1、這種方法要求在歸檔有備份的方式下進行,而且是建議方式;
2、這種方法不會導致數據庫的錯誤。
5.4 損壞臨時數據文件的恢復方法
 
臨時數據文件的恢復是比較簡單的,因為臨時文件中不涉及到其它的有用的數據,所以可以刪除后重建。
1、關閉數據庫:
sql>shutdown immediate
2、刪除臨時數據文件,模擬媒體失敗;
 
3、啟動數據庫,檢測到文件錯誤;
 
4、脫機該數據文件:
sql>alter database datafile '文件名全名' offline drop;
 
5、打開數據庫
sql>alter database open
 
6、刪除該臨時表空間
sql>drop tablespace temp(或其它臨時表空間名稱);
 
7、重新創建該表空間,并重新分配給用戶。
說明:
1、臨時數據文件是非重要文件,不保存永久數據,可以隨時刪除重建,不影響數據庫的數據安全;
2、如果重新建立以后,別忘了重新分配給用戶。
第六章. 常見恢復誤區
1、可以不需要備份,只有歸檔就能進行數據庫的向前的恢復
答:這個在oracle 9i以前起碼是不可能的,在別的數據庫我也沒有聽說過,不完全恢復的主要思路是利用不完全點之前的備份,加上歸檔日志,恢復到不完全恢復點,9i中出現了一個flashback的特性,這個特性的使用,也是有很多局限的。
2、進行不完全恢復只需要拷貝一個需要恢復的備份數據文件
答:不完全恢復需要拷貝所有的數據文件,最好包括臨時數據文件在內,否則需要另外的處理,如果有一個數據文件的scn大于不完全恢復點,那么這個恢復都將是失敗的。
3、使用rman目錄與目標數據庫在同一數據庫能很好進行數據庫的恢復
答:使用恢復目錄與目標數據庫在同一個數據庫中,將存在很大的恢復局限,如該數據庫的系統數據文件的損害,數據庫根本不能open,那么rman也就無法連接恢復目錄,也就不存在恢復了。
第七章. 小結
這里我們反復演示了多種情況下的恢復方案,通過這些演示,我們應該掌握了如下內容:
1、利用os與rman進行各種常規備份與恢復。
2、熟悉沒有備份或簡單的非常規備份與恢復的方法。