「PC」カテゴリーアーカイブ

RAID障害修復の闇5

結論から言うと・・・成功

TX1310M5のRAIDはIntel VROC

インテル® Virtual RAID on CPUの概要(インテル® VROC)

設定はBIOSでRAID Modeにすると、メニューに出てくる。

RAID1のリビルド中に、シャットダウンしても
再起動後にリビルドが再開できた。

SEL(ログ)を見ると、シャットダウンのログ、リビルドのログが
きちんと出ていました。(Infoとして)

RAIDチップによっては、初めからやり直しのものもあるらいしい。

まずは、失敗しなかったことに安心した。

以上!

RAID障害修復の闇4

補足

BIOSのRaidManagerでVolume0をRebuiledにしたら

そのままではなく、BIOSを抜けてWindowsを起動するのだ

自動リビルドのおかげで、ビルドがバックグラウンドで実行される。

進捗を確認するには

FUJITSU ServerView iRMC S6 Web Serverを起動?Webなので接続

あらかじめBIOSで設定が必要。

IPアドレス

TX1310M5はLANポートが3つある
上から、メンテポート、スレーブポート、プライマリポートとなるようだ

メンテポートのIPを設定しておく(BIOS)

そこに別PCから覗く

Adminでログイン

外部記憶装置の画面

この時点で19%

ん~、推測時間は約100時間ですね。(1%=1時間くらい)

このまま進めるしかない

RAID障害復旧の闇3

サーバーが帰ってきました。

早速、覗いてみます。

元のままです。

当然だ

ここからは復旧の手順です。

Intel VROC Raid Managerのマニュアルを熟読・・・

YouTubeで、似た事例を探して視る

ほ~

理解

RAID の画面には
Raid Volume0 Failed・・・

Volume0の中を見ると
Reset to Degraded ボタンがでていた。

まず、これを実行する。

Reste to Degraded

を選択して、対象のPort3(正常のHDD側)のDriveを選択

Yes

前に戻ると
Raid Volume0 Degradedになった。

BIOSを抜けて、電源OFF

故障したHDD1(Port2)を新品に交換

電源投入して、BIOS、Raid画面へ

Rebuildボタンが出た!

ボタンを選択して、セットしたPort2を選択して
Yes

Rebuildingとなった

あとは、成功するか、待つのみ・・・

4TBなので時間かかりそう・・・

20~30時間?

RAID障害復旧の闇2

HDD・RAID障害復旧専門業者に一応、出しました。

で、調査見積出ました。

98.8%で復旧できそうです。

すごい金額でした。

今回はお断りしました。

断った理由

1.バックアップが見つかった
 NASにバックアップが正常とれていた。
2.復旧方法がファイルのコピーだった
 HDDを購入して、それに復旧できたファイルをコピー。
3.金額が高い。

闇・・・

そのあと、別の担当者から2回電話ありました。

本当に良いですか?的な・・・

理由を聞かせてください。・・・サーバー復旧を優先したいので返してほしい。

金額ですか?・・・はい、ちょっと諦めます・・・

2回目は・・・

まだ、他にも方法はあります、私たちに手伝させてください。

金額を半額+成功報酬分でいかがですか?

結構です。

RAID障害復旧の闇

サーバーでRAIDを組むのは基本かと思う

障害に対して保険をかけている状態

2台でRAID1を構築する

1台がエラーを吐いている・・・交換の準備だ

同一規格のHDDを購入して、交換する。

RAID Managerで、リビルドを実施することで復旧

で、ここからが闇・・・

交換するべきHDDを間違えた・・・HDD1が故障なのにHDD2を抜いた

RAID Managerで、いらんことしたようだ

RAID情報が壊れてしまい

リビルドできない状態・・・

これ以上触ると、最悪の事態に・・・

この時点で、バックアップのNASが覗けない事態・・・

え?え?え?え?え?

血の気が引いた

今できること・・・

HDD・RAID障害復旧対応業者に電話した

受付で症状を話して、依頼することに・・・

平均的な価格は、見てから復旧可能かで、判断してください。

だいたい、そのケースだと、100万~200万というのが平均的な価格です・・・

きたー!

調査は無料なので、送ってください・・・(配送業者を手配します)

つづく・・・

HDL4-X4その2

HDL4-X2に続いて、HDL4-X4を入手していたが
前回、復旧に失敗してしまい、マスターOSを初期化してしまった

今回、マスターOSを入手できたので再挑戦

LANDISKの機能をマニュアルで理解して、今回は失敗しない。

結果、うまく動作した。

1TBが4台で、合計2TBのNASが出来上がった。

2台でRAID1が2組でRAID0構成となるようだ

((1TB・1TB)RAID1+(1TB・1TB)RAID1)RAID0

このNAS、更にUSD-HDDを拡張ドライブとして増設できるのだ。

HDL4-X2/HDL2-X2

IO-DATAのNASです。

中古で入手して、HDL2は復元できたというか、動いた。

HDL4はHDDがまっさらだったので、起動しません。

NASOSの入ったHDDを入手すれば動くようだ。

で、Yahoo!オクでHDDを入手した。

起動したが、設定をミスったのか、二度と起動しなくなった

初期化してしまったようだ。

やっちまった・・・

いろんなこと試したが、二度と復旧しない。。。

で、また、HDDをぽちった・・・待つか・・・

ね。

初期化って、本当に初期化だったのね・・・

TX1310M3-RAID1

Fujitsuのサーバー

TX1310M3でRAID1の構築と障害時のリビルドをやってみた

HDDは500GBを2個用意して、セットしてから
BIOSを起動して、Raid Controllerを選択する。
まず、その前に、ModeをRAIDにして保存してBIOSを再起動
するとRaidの設定ができるようになる。

MegaRaid

Create Configrationをして
Raid をRAID1に選択
Driveを2セットした2台をEnabledにする。
WCをEnabled
Configを保存

Select Device Managerで
OperationをFast Initializeを選択して
OperationをStart

LEDの点滅が終われば、終わったことだろう

BIOSをExitできれば、間違いない

OSをインストールする。
※追記:Raid(SATA RAID)のドライバーを用意しておく
 ないとインストール時にHDDが認識されない

簡単な設定をしておく、リモートとかPC名とか

念のため、ServerViewRAIDをインストールする。
※TX1310M3まで対応(M5は非対応:iRMCに統合)

RAID Manager Local HTML5(Fujitsuフォルダ)を起動して
RAIDの状態を確認できる

さて、ここから

RAID1の1台が故障したと想定
HDD2を抜いて(もち電源OFF)、それを初期化する
初期化は、別のPCにつないで、DISKPARTで4つあるパーテションを削除していく

LIST DISK
SELECT DISK 1 (対象HDDを選択)
LIST PARTITION
SELECT PARTITION 4
DELETE PARTITIN OVERRIDE

これをPARTITION 1まで繰り返す

ディスクの管理でみると、まっさらな状態(未割当)となる

これを、サーバーのポート2へ戻す。

電源を入れると、Windowsが起動する。

Server View RAIDを覗くと、リビルド中と表示されている。

残り時間は、3時間20~と表示されていた。

まぁどこまで信頼できる時間か・・・

500GBですからね・・・今度、対応するサーバーは4TBなんだが・・・

とりあず、お客さまのサーバーにもServer View RAID Managerを入れるべきだ・・・

今のところ
TX1310M3が2台
TX1310M5が1台

TX1310M5は、Server View RAID Managerが非対応になった
iRMCに統合された。
しかも、専用のLANポートもある(CPUがXEONのみ)

日々勉強・・・

結局、リビルドは3時間と少しかかった。
ほぼ正確な時間表示だった

500GBで3時間として4TBだと、8倍?
24時間か・・・

HDDを発注した・・・

SUNEAST SE900

Amazonで安いSSDを購入した。

2~3年くらい前に、安いSSDとして人気沸騰?

本社は東京?と大阪?、日本にある企業
※中身的には中国系かな

製造はもちろん中国です・・・たぶん

気が付くと10個近く購入してるかな

購入は1TBが多いかな、安いので

Amazon

最近、SE900の1TB・・・ないですね。
当時、5,6千円?だったきがする

最近、2年前に購入したSE900-1TBがフォーマットできなくなった

ネットで同じものを探しても、1TBモデルがなくなった
128・256・512GB

別モデルで512・1・2GBが出ている。
でも、2倍くらいの価格

修理交換の申請をしてみる

Port=80

Apacheが起動できない。

ログを見るとPort=80が・・・と出てます

ん?

なんか使っていたっけ?

Copilotに聞いて調べても、WindowsがSystemで使用していますね・・・と

え?

で、やっと判明したのが・・・IIS

ああ~

削除して

netstat -aon | findstr :80

なにも出ません

動いた・・・すごい時間かけて・・・

つかれた