NASのRAID5でリビルド失敗!HDD2台故障からのデータ復旧事例とNG行動

NASのRAID5でリビルド失敗!HDD2台故障からのデータ復旧事例とNG行動

最終更新日:2026年03月03日

NASのRAID5でリビルド失敗!HDD2台同時故障の絶望からデータを救い出した復旧事例と「絶対NG行動」

「NASのHDDが1台壊れたので新品に交換してリビルド(再構築)をかけたら、途中でエラーが出て全データにアクセスできなくなった」。
これは、企業のファイルサーバーや家庭用NASで発生するトラブルの中で、最も恐ろしく、かつ最も頻発する「データ完全消失の黄金パターン」です。

RAID5は「HDDが1台壊れても稼働し続け、新しいHDDを入れれば元通りになる」という安全な仕組みのはずです。なぜ、マニュアル通りにリビルドを行ったにも関わらず、全滅という最悪の事態を招いてしまったのでしょうか。

この記事では、OpenLabに実際に持ち込まれた「RAID5リビルド失敗による崩壊事例」をベースに、なぜリビルドが失敗するのかという物理的メカニズムと、バラバラになったRAIDのパズルを解き明かすプロの復旧技術について、ケーススタディ形式で詳細に解説します。

  • RAID5崩壊
  • リビルド失敗
  • NAS復旧
  • 2台同時故障
  • データ復旧事例
目次

1. 【事例概要】ある日突然起きたNASの異変

本ケーススタディは、都内のデザイン制作会社様からご依頼いただいた、4ドライブ構成のNAS(RAID5)のトラブル事例です。社内の全データ(過去のデザインデータ、進行中のプロジェクトファイル、経理データなど約4TB)が保存されていました。

HDDのエラーランプ点灯と「デグレードモード」

ある月曜日の朝、出社したスタッフがNAS本体から「ピーッ、ピーッ」という警告音が鳴っていることに気づきました。
本体を見ると、4つのドライブランプのうち「HDD-1」のランプが赤く点滅していました。
管理画面にログインすると、「HDD-1で障害が発生しました。デグレードモードで動作中です」というメッセージが表示されていました。

デグレードモード(縮退運転)とは、RAID5において1台のHDDが壊れても、残りのHDDを使ってシステムを止めずに稼働させ続ける状態のことです。この時点では、社内のパソコンから通常通りファイルを開くことができていました。

マニュアル通りの「リビルド(再構築)」を実行

担当者様は、NASの取扱説明書に従い、すぐに近所の家電量販店で同容量の新しいHDDを購入してきました。
そして、エラーが出ている「HDD-1」をNASから引き抜き、買ってきた新しいHDDを挿入しました。
管理画面から「RAIDアレイの再構築(リビルド)」のボタンをクリックし、進捗バーが動き始めたのを確認して、安心して業務に戻りました。

リビルドが途中で停止、すべてのデータが消えた

数時間後。リビルドの進捗が「45%」のあたりでピタリと止まり、NASから再び不穏な警告音が鳴り響きました。
今度は、今まで正常だったはずの「HDD-2」のランプが赤く点灯し、NAS自体のネットワーク接続が完全に切断されました。
社内のすべてのパソコンから共有フォルダにアクセスできなくなり、再起動を試みるも「RAIDアレイが破損しています」という絶望的なエラーが表示されるだけになってしまいました。
ここで初めて事態の深刻さに気づき、OpenLabへ緊急の復旧依頼が持ち込まれました。

2. なぜ「リビルド」は失敗したのか?(原因解説)

メーカーのマニュアル通りに対処したのに、なぜシステムは崩壊したのでしょうか。それはRAID5の仕組みと、HDDの物理的な寿命の性質に原因があります。

RAID5の仕組み:パリティ(計算式)によるデータ保護

RAID5は、3台以上のHDDを使ってデータを分散して保存する仕組みです。この時、データだけでなく「パリティ」と呼ばれる復元用の計算データも各HDDに分散して書き込まれます。

もしHDDが1台壊れても、残りのHDDに入っている「データ」と「パリティ」をパズルのように掛け合わせることで、失われた1台分のデータを計算して補うことができます(これがデグレードモードです)。
そして、新しいHDDを入れたときに行われる「リビルド」とは、この計算式を使って失われたデータをひたすら算出し、新しいHDDに書き込んでいく作業です。

リビルドは「HDDへの究極の拷問」である

この「計算して書き込む」という作業を行うためには、生き残っているすべてのHDDの「全領域(数TB)」を、端から端まで100%全力で読み込み続ける必要があります。
通常業務での読み書きとは比べ物にならないほどの凄まじい負荷が、数時間〜十数時間にわたってHDDのモーターや磁気ヘッドにかかり続けます。

同時期に買ったHDDは、同時期に寿命を迎える

NASに搭載されている4台のHDDは、すべて「同じ製造工場」で「同じ時期」に作られ、NASの中で「同じ温度」「同じ時間」だけ稼働してきた双子のような存在です。
つまり、1台目(HDD-1)が経年劣化で寿命を迎えて壊れたということは、隣にあるHDD-2やHDD-3も「いつ壊れてもおかしくない寿命ギリギリの状態」だったのです。

その瀕死のHDDたちに対して、リビルドという「フルマラソン」を強制した結果、力尽きていたHDD-2が途中で心肺停止(物理障害)を起こしてしまった。これが、今回の事故のメカニズムです。
データ復旧業界では、「リビルドはトドメの一撃」として非常に恐れられている行為です。

3. 初期診断と障害状況の全貌

OpenLabのラボに到着したNASを分解し、4台のHDDすべてを専用機材(PC-3000)で個別に初期診断しました。

HDDごとの精密診断結果

  • HDD-1(最初にエラーが出たHDD):
    重度の物理障害。「カチカチ」という異音が発生しており、磁気ヘッドが完全に破損。クリーンルームでの開封手術が必要な状態でした。
  • HDD-2(リビルド中に止まったHDD):
    中度の物理障害。モーターは回るものの、ディスクの表面に「不良セクタ(読み込めない傷)」が大量に発生しており、これに引っかかったことでリビルドがフリーズして停止していました。
  • HDD-3、HDD-4:
    論理的には無事ですが、不良セクタの初期症状が見られ、かなり弱っている状態でした。
  • 新品のHDD(リビルド用に入れたもの):
    中途半端にデータが書き込まれた状態(全体の45%のみ)であり、復旧には使えません。

2台の故障による「RAIDアレイの完全崩壊」

RAID5は「1台の故障」までは耐えられますが、「2台の故障」が起きた瞬間、計算式が成り立たなくなり、RAIDアレイは完全に崩壊します。
データは4台のHDDに細切れにされて保存されているため、このままではどのHDDをパソコンに繋いでも、断片的なゴミデータしか見えません。すべてのデータをパズルのように繋ぎ合わせる必要があります。

4. OpenLabの復旧プロセス:絶望からのデータ抽出

この絶望的な状況からデータを救うため、以下の3つのステップで高度な復旧対応を行いました。

Step1:HDD-2(物理障害)のクリーンルーム処置

まず、データ復旧に最低限必要な「3台分の健全なデータ」を確保しなければなりません。
HDD-3とHDD-4は無事なので、あと1台、「最初に壊れたHDD-1(ヘッド破損)」「リビルド中に止まったHDD-2(不良セクタ)」のどちらかからデータを抜く必要があります。

今回は、データが最新の状態(リビルド直前)で残っているHDD-2を優先して処置しました。
HDD-2は不良セクタが多発していましたが、PC-3000のハードウェア制御を用い、エラー箇所を瞬時にスキップし、電圧を微調整しながら、傷のない領域のデータを慎重に読み出しました。数日間の作業の末、HDD-2の物理イメージ(クローン)を99%以上の精度で抽出することに成功しました。

Step2:不良セクタの回避と全HDDのクローン作成

同時に、弱っていたHDD-3とHDD-4についても、これ以上負荷をかけて壊さないように、PC-3000を使って安全にクローン(複製)を作成しました。
これで、「HDD-2のクローン」「HDD-3のクローン」「HDD-4のクローン」という、仮想的な再構築に必要な3枚のピースが揃いました。(HDD-1は今回使用しません)

Step3:バイナリ解析による「仮想RAID再構築」

ここからが、エンジニアの知識と経験が問われる「論理的なパズル解き」です。
Linuxベースで動くNASのRAID構成情報は、リビルドの失敗によって上書き・破損してしまっていました。そのため、自動ソフトでRAIDを組もうとしてもエラーで弾かれます。

エンジニアは、バイナリエディタを使ってHDDの生データ(16進数)を目視で確認し、以下の隠されたパラメータを手動で特定しました。

  • ストライプサイズ:データを何KB単位で細切れにしているか(例:64KB, 128KB等)
  • ディスクの順番(ドライブオーダー):HDD-2,3,4が、元々どの順番で並んでいたか
  • パリティの回転方向:パリティデータがどの規則で配置されているか(Left Asynchronous等)

これらのパラメータを正確に割り出し、専用の解析ソフトに入力することで、ソフトウェア上で「壊れる前のRAID5の形」を仮想的に組み上げました(仮想RAID再構築)。
パズルが正しく組み合わさった瞬間、画面上に「過去のデザインデータ」や「経理フォルダ」のディレクトリツリーが美しい階層で表示されました。

5. 復旧結果と、事故を防ぐための教訓

復旧可否の目安98%以上で無事に納品

仮想RAIDからデータを抽出し、ファイル破損チェックを行った結果、システムファイルの一部に欠損はあったものの、お客様が最も必要としていたデザインデータや業務書類は98%以上の完全な状態で復旧することができました。
抽出した約4TBのデータは、弊社で用意した頑丈な外付けHDDに保存し、ご依頼から約1週間でお手元へ納品いたしました。

教訓①:エラーが出たら「リビルド」ではなく「バックアップ」

今回の事故の最大の分岐点は、「HDDが1台壊れた直後の行動」でした。
マニュアルには「新しいHDDを入れてリビルドせよ」と書かれていますが、データ復旧の観点からは非常に危険です。
デグレードモード(1台壊れても動いている状態)の時は、まだデータにアクセスできます。この瞬間に、NASのデータを別の外付けHDD等に「バックアップ(コピー)して退避させる」のが最優先です。
データの安全を確保してから、ゆっくりとリビルドをかけるべきでした。

教訓②:RAID6の導入検討と「3-2-1ルール」の徹底

RAID5は、大容量化が進む現代のHDDにおいては「リビルド中の2台目故障リスク」が高すぎるため、時代遅れになりつつあります。
重要な業務データを扱う場合は、2台同時故障まで耐えられる「RAID6」を導入することを強く推奨します。
そして何より、「RAIDはバックアップではない」という事実を認識し、NASとは別の物理的な場所(外付けHDDやクラウド)にデータを複製する「3-2-1ルール」の運用が不可欠です。

よくある質問

リビルド中に止まってしまった場合、元のHDDに戻せば直りますか?

絶対に直りませんし、非常に危険です。NASのシステムは「元のHDDはすでに壊れたもの(無効なデータ)」として扱います。無理に戻して再起動すると、RAIDの構成情報が完全に矛盾し、フォーマット(初期化)が促されてデータが完全に消滅するリスクがあります。止まった時点で即座に電源を切り、プロにご相談ください。

4台のNASで2台壊れている場合、料金はHDD2台分ですか?

OpenLabのRAID復旧は、構成するHDDの台数によって料金が変わります(例:4ドライブ構成なら、基本料金×4台分)。ただし、物理障害(クリーンルーム作業など)が複数台に及ぶ場合でも、「定額制の上限」を超えて青天井に高額になることはありません。事前にお見積もりを提示し、納得いただいてからの作業となります。

まとめ

  • Point

    1台故障時の「リビルド」は超高負荷。弱った2台目のHDDを殺す原因になる。

  • Point

    RAID異常時は、リビルドする前に「別のメディアへデータを逃がす」のが鉄則。

  • Point

    2台故障でRAIDが崩壊しても、OpenLabのバイナリ解析と物理修復でデータ復元は可能。

RAIDトラブルは、企業の存続に関わる重大な危機になり得ます。
「マニュアル通りにやったのに」「設定画面の指示に従ったのに」と後悔する前に、NASから普段と違う警告音が鳴ったら、まずは冷静に電源を落としてください。
そして、高度なRAID解析技術と物理障害対応設備を併せ持つOpenLabへ、すぐにご連絡ください。バラバラになったデータのピースを拾い集め、あなたのビジネスを再び動かします。