PowerEdge1950 で RAID 1 へとレベル変更 (PERC 6/i)

Changing RAID level to RAID 1 on Dell PowerEdge1950 PERC 6/i without losing data, by SHIBATA Akira
作成 2014/10/22

はじめに

職場で使用されている Dell の PowerEdge1950 の HDD が壊れた。  RAID 1 が組まれていたそうだが自動的に再構築されなかった。  スペック上はホットスワップできるらしいが、再構築されないなら手動で再構築しようということでそのやり方を調べた。  一応当方の手元で再現性をもって PERC 5/i で RAID 1 の手動再構築できたのでレポートを記述した。 

ところが、サーバを調べるとなんと RAID が組まれてないサーバがあることがわかった。  試行錯誤を繰り返して、無駄はあるかもしれないが、再現性のある方法で RAID なし(表示は RAID Level 0 )から、データを失わずに RAID 1 へと変更することができたのでレポートを記述した。  なお、見た目が少々違うだけで、基本的には前バージョン( PERC 5/i )での作業とほぼ同じだ。 

PERC 6/i Integrated BIOS Configuration Utility 1.21.02-0528 にて実験した。  理由はわからないが、マニュアルがマサチューセッツ工科大のページにあったのでそれを参照した。 

無保証

人体や財産に重大な危険を及ぼす恐れアリ

当然だが、当方の場合はこれでできたということで無保証である。  当方が試行錯誤を繰り返して、一応再現するっぽいところまできたので、ここに掲載するが、上手くいかなくて、データが消えても責任は取れないし、取るつもりもない。 

作業にあたり

PowerEdge1950 で RAID 1 ができる構成になっていることが前提であり、ファームウェアのバージョンなどが違っていたりしたときには同じように動くかどうかはわからない。  画面の上部には次のようにでていた。  PERC 6/i Integrated BIOS Configuration Utility 1.21.02-0528

画面をキャプチャすることができないので、デジカメで写真を撮っておいた。  ヒントになればいいかな。  画像をクリックすると拡大できるハズだ。 

作業の実際

作業は慎重に行おう。  壊れたら、構築し直しだ。  できるならバックアップとっておこう。 

0. 確認

壊れた HDD を引っこ抜いて、片肺だけで起動することを確認しておこう。  残った HDD だけで、電源投入して起動するなら間違いない。  当方のところの PowerEdge1950 はドライブとしては二基設置でき、左側は 0 、右側は 1 と表示されている。  残った HDD は、左右どちらでも、すなわちベイ番号 0,1 のいずれに設置した状態でも起動できた。  差し替えたときには Foreign config を import すると起動できることがわかった。  わかりやすくするために、ベイ番号 0 のほうに元となる正常 HDD を挿して作業した。  したがって残りのベイ番号 1 のほうには新しい HDD を挿入した。 

1. RAID 構築画面に入る

電源を入れると DELL のロゴ画面がでて、しばらくすると文字が出始める。  そした Ctrl キーを押しながら R キーを叩いてちょっと待つ。 


PowerEdge Expandable RAID Controller BIOS
Copyright(c) 2008 LSI Logic Corporation
Press <Ctrl><R> to Run Configuration Utility

起動画面

黒い画面から下のようなターコイズな色風な画面になったらうまく構築画面に入れたときだ。  右ペインの RAID Level が 0 となっている。  この状態からこれを 1 にして、どちらの HDD が壊れても大丈夫なようにする。 

構築最初の画面

もし、 Foregin configuration(s) found on adapter と出てきたときは、 HDD が起動できる状態になっていないことがわかる。  そういうときは Foreign config を import すると起動できることがわかった。 

3. 構築作業

ヘンなところで電源切ったりして、いろいろビビるが、この方法でできた。  また、無駄な作業が混ざっているかもしれないけれども、再現性もあるこの方法を書いておく。 

3-1. HDD 挿入

ここで HDD を 1 のほうのベイに挿入する。  すると、上部メニューに Foreign View という項目が増える。 

上部メニューに Foreign View という項目が増えた画面

ここで [F2] を押下して、「 Reset Config 」を選んで [Enter] する。  確認がでるので OK を選んで [Enter] だ。 

Reset Config 確認画面

何もなくなった画面になる。  すげービビるが、一応これでできることがわかった。  なぜこれでできるかは今でもよくわからない。 

何もない画面

次に後から挿した HDD を繰り入れる。  ここで [F2] を押下して、「 Foreign Config 」→「 Clear 」を選んで [Enter] する。  確認がでるので OK を選んで [Enter] だ。  上部メニューの Foreign View が消えることで成功したことがわかる。 

Foreign Config → Clear 確認画面 Foreign View がなくなった

3-2. RAID 構築

次に RAID 構築設定だ。  ここで [F2] を押下して、「 Create New VD 」を選んで [Enter] する。 

Create New VD

RAID 0 ハイライトで [Enter] を押下して、「 RAID 1 」を選んで [Enter] する。 

RAID 選択画面 RAID 1 を選択したところ

Physical Disks は [Space] で両方とも選んで [X] という状態にして選択する。  [Tab] を何度か叩いて、「 Advanced Settings 」を [Space] で [X] にする。  さらに下に行って、「 Configure HotSpare 」に [X] を入れておくと、 HDD を入れ替えたときに自動再構築ができることが多い。  なぜかその設定をいれても自動再構築がなされないこともあったが、その時は手動構築開始のレポートを見て、再構築をすればよいだろう。 

Physical Disks 選択 Configure HotSpare 選択

これで「 OK 」を選択し、確認してくるので、再度「 OK 」すると、できねーぜと言われて CANCEL しかできない状態になる。   ここで、電プチ(電源スイッチを押して電源を切る)するのだ。  CANCEL すると HDD の内容が壊れることがある。  なんでもいいから、 CANCEL せずに電プチしろ。 

OK を選択した後の確認画面 CANCEL しかできない

3-3. 実際の HDD コピー

電源を切ったら、一回深呼吸して電源を入れよう。  電源を入れて、 OS を起動しないで、かならず設定画面に入ろう。  ここでボケっとして OS を起動すると HDD のデータが書き換えられて失敗した。 

電源を入れて、 OS を起動しないで、かならず設定画面に入ろう。  ここでボケっとして OS を起動すると HDD のデータが壊れて失敗した。  大切なことなので二度書きました。 

設定画面に入ると、一見成功しているように見えるが、そもそも同期というかコピーされてないから、ベイ 1 の HDD は不完全な状態である。  そこで、強制的にコピーするわけだ。 

成功っぽく見える

強制的にコピーするには、一回ベイ 1 の HDD を抜く。  抜くと Virtual Disk 0 が黄色くなることで、何かが起こったことがわかる。 

HDD 引っこ抜いた後

ベイ 1 の HDD を抜かれたことをシステムが認識したら、再度 HDD を挿し込もう。  うまくいくと自動再構築が始まる。  自動再構築がうまくいかなかったら、手動構築のレポートを見て、再構築をすればよいだろう。 

再構築開始 再構築中

4. 終了確認

あとは再構築が終わるのを待てばよい。  仕様不明の SATA で時速 150GB くらいだったが、仕様不明の SAS 300GB が 30 分程度だったから、時速 600GB くらいありそうだ。  進行状況は Ctrl+P または Ctrl+N で VD Mgmt 画面にして、 Physical Disks の内容確認( [→] で展開して見られる)で、おおよその終了時刻も確認できるだろう。  また、構築はこの画面を表示している必要はなく、始まったら、 [Ctrl]+[Del]+[Delete] でこの画面を抜けて OS 起動してもよかった。 

構築が終わると最初の画面になる。  一応 Physical Disks を見ると Missing でもなく、何事もないように表示されている。  強制コピーする前とも区別がつかないが、たぶんうまく行っている。 

構築が終わった状態の画面

終わったら、 [Esc] を叩いて、構築画面を抜け、 [Ctrl]+[Del]+[Delete] で再起動してみよう。  うまくいっていれば、いつものように起動するハズだ。  ただし、 HDD のアクセスランプは 2 台の HDD 両方が明滅することが見て取れる。 

結びに

非常にハマったが、再現実験をして確認もできることがわかった。  当方の探し方が悪かったのか見つけられなくて、自分で書いちゃった。 

この PowerEdge1950 の RAID 1 だが、本当は自動再構築も最初にやっておかなくちゃいけないが、後からでもできたのでここに記しておく。  作業失敗すると RAID 1 でなくなってしまったり間違って消したりずいぶんと失敗した。  再構築に入ったら [Ctrl]+[Del]+[Delete] で再起動をかけても問題ないことがわかった。  すなわち、構築が始まったらサーバを動かせるので、ダウンタイムは、最初の OS シャットダウン、この構築開始までの時間、そして OS 起動時間ということで 15 分以内でできるかもしれない。  当方と同じように、こんな目に遭う人がいなくて、当方の書いたこれが無駄であるといいとは思う。 

この文書をお読みの貴方が、どういう理由でこの文書にたどり着いたかはわからないが、この文書が役に立つことを願う。  そして、困ったことが改善されることを願う。  Good Luck!


Memorandum about Linux and Network | ほかのジャンルを見てみる | サイトマップ

免責

beacon

当方(SHIBATA Akira)は, 本サイトをご利用の際に起きるかもしれない不利益に対し, 一切責任を負いません.