RAIDだけではバックアップ機構としては不十分である
大事な個人的データをちゃんとバックアップしたいなあと思って、RAIDつきのNASを検討していて近くの人に相談したところ「RAIDだけじゃだめだよ」と言われました。なんで?と聞き返したところ
「ファイルシステムが逝っちゃったら終わりだから」
と説明され、色々考えて、納得した話です。
なぜRAIDだけでは不十分なのか
RAIDを使うと、物理的な冗長性を持たせることができます。( RAID - Wikipedia ) 誤って手動で削除しちゃったときなんかはダメですが、それは仕方が無いでしょう。また、手動の削除ミスにすぐ気がつけば、削除したファイルを復活させられる道も残されています。
しかしファイルシステムが逝ってしまった場合はどうにもなりません。ソフトウェア的な問題でインデックス領域を破壊されてしまった場合、物理的には何も問題は無く、RAIDの冗長化では破壊された状態がきっちり冗長化されるだけなので全く無力です。復活ツールで復活させられる可能性も低くなるでしょう。
大事なデータは別のファイルシステムへ定期的にコピーする
というわけで大事な個人的データのバックアップの今のところの結論としては、何らかの手段で別のファイルシステムへ定期的にコピーすることにします。リアルタイムではないので定期バックアップ前のマスターストレージの突然の物理障害に対しては無力ですが、本当に大事なデータを保存するときはすぐにバックアップを作動させることでリスクを減らしたいと思います。マスターもバックアップ先もRAIDにしてしまえば最強ですが、万単位の価格差があるので考えどころです。
最近のNASはNAS自身にUSB接続でディスクを増設して、接続先のディスクにNAS内のデータをバックアップできるものが多いですね。それでもいいのですが、NAS自身がディスクを複数台搭載できて、RAIDは使わず、ディスク毎にファイルシステムを構築できて、ディスク間で定期的に同期できるものがあるといいなあと思っています(あるかどうかは未確認です)。電源もひとつですみますし。電源がひとつになるのは冗長化的にデメリットでもありますが、NASの電源が逝ってもディスクさえ無事ならなんとかなるでしょう。
この記事を書いた経緯は「DreamHostに怒られたから」
ちなみになぜこの記事を書いたかというと、実はレンタルサーバーの DreamHost (レンタルサーバ DreamHost がすごい - d.hetima) をバックアップ用途に使っていたら中の人に怒られたからでした(すみません><)。WebプランはWeb以外のストレージ用途に使うのは利用規約違反のようです。どうやら使用容量を自動的に監視していて、中の人にAlertする機能があるようです。AlertがくるとWebへのトラフィックを確認して、見合ったトラフィックが流れていなければ怪しいと判断するのでしょう。
なお、ストレージ用途に使うにはWebプランよりも割高だけど、データが消えないことを保証するストレージ用の別プランがあるようです。
というわけで、バックアップは計画的にどうぞ。 :)
2008-06-25 追記:「バックアップとRAIDは無関係」とのご指摘を頂いております。すみません、その通りです。ただ個人用途におけるバックアップはいわゆるバックアップというよりも、マスターストレージの物理障害対策として行われている場面も多いと個人的には思いますので、あえてこの文脈のまま残させて頂きたいと思います。
オンボードの安物や↑100kのエンタープライズ品まで扱ってるけど、
ファイルシステムが壊れて復旧できなくなったなんて話は聞いたことがない
>「ファイルシステムが逝っちゃったら終わりだから」
>と説明され
よほど腐ったOSとハードウェア使ってたんでしょうね。可哀想です><
IT業界のほとんどが、その“よほど腐ったOSとハードウェア”で出来てるって、、、
不思議!!
そもそもバックアップとレイドは無関係だし規約違反していた事を公開するのは如何なものでしょうか