


HP ProLiant MicroServer N54Lにメモリ16GB,HDD 3.0TB×3,250GB×1の構成でFreeNAS 9を使用してZFS(RAIDZ1+Stripe)で動作させています
ここで壊れるのを覚悟で試しに電源投入状態でいきなりHDDを抜いてみました
抜いたのは250GBのHDDでStripeになります
HDDを抜いて5分ぐらいしてから試しに作成したWindows共有フォルダにアクセスしてみました
共有フォルダやファイルにアクセスはできますが、新たにフォルダ・ファイルを作成するとエラーになります
それでも共有フォルダからローカルHDDにファイルのコピーはできましたから凄いです
shellからコマンドで確認してみます。HDDがREMOVEDになっています
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 |
; html-script: false ][root@freenas] ~# zpool status pool: zfs state: UNAVAIL status: One or more devices are faulted in response to IO failures. action: Make sure the affected devices are connected, then run 'zpool clear'. see: http://illumos.org/msg/ZFS-8000-JQ scan: scrub repaired 0 in 0h15m with 0 errors on Sun Oct 20 18:07:31 2013 config: NAME STATE READ WRITE CKSUM zfs UNAVAIL 0 0 0 8381737750083271232 REMOVED 0 0 0 was /dev/gptid/b0432b45-3888-11e3-852b-38eaa7a93846 raidz1-1 ONLINE 0 0 0 gptid/b0b6f615-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 gptid/b12ad6f3-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 gptid/b1aa0cf3-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 errors: 5 data errors, use '-v' for a list [root@freenas] ~# zpool status -v pool: zfs state: UNAVAIL status: One or more devices are faulted in response to IO failures. action: Make sure the affected devices are connected, then run 'zpool clear'. see: http://illumos.org/msg/ZFS-8000-JQ scan: scrub repaired 0 in 0h15m with 0 errors on Sun Oct 20 18:07:31 2013 config: NAME STATE READ WRITE CKSUM zfs UNAVAIL 0 0 0 8381737750083271232 REMOVED 0 0 0 was /dev/gptid/b0432b45-3888-11e3-852b-38eaa7a93846 raidz1-1 ONLINE 0 0 0 gptid/b0b6f615-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 gptid/b12ad6f3-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 gptid/b1aa0cf3-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 errors: Permanent errors have been detected in the following files: zfs/MediaStrage:<0x55> zfs/MediaStrage:<0x5b> zfs/MediaStrage:<0x64> zfs/MediaStrage:<0x76> zfs/MediaStrage:<0x79> |
さらに管理画面にアクセスするとログインはできますがメニューが表示されません。ここから何か操作して復旧は難しそうなのでsshdは必ず有効にしておいた方が間違いはないでしょうね
さて外したHDDを再度装着してみます
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
; html-script: false ][root@freenas] ~# zpool status pool: zfs state: UNAVAIL status: One or more devices are faulted in response to IO failures. action: Make sure the affected devices are connected, then run 'zpool clear'. see: http://illumos.org/msg/ZFS-8000-JQ scan: scrub repaired 0 in 0h15m with 0 errors on Sun Oct 20 18:07:31 2013 config: NAME STATE READ WRITE CKSUM zfs UNAVAIL 0 0 0 8381737750083271232 REMOVED 0 0 0 was /dev/gptid/b0432b45-3888-11e3-852b-38eaa7a93846 raidz1-1 ONLINE 0 0 0 gptid/b0b6f615-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 gptid/b12ad6f3-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 gptid/b1aa0cf3-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 errors: 40 data errors, use '-v' for a list |
errors: 40 data errorsと増えていました
状態をClearしてみます.”ONLINE”になりましたが壊れたファイルが40なのは変わりませんでした
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 |
; html-script: false ] [root@freenas] ~# zpool clear zfs 8381737750083271232 [root@freenas] ~# zpool status pool: zfs state: ONLINE status: One or more devices has experienced an error resulting in data corruption. Applications may be affected. action: Restore the file in question if possible. Otherwise restore the entire pool from backup. see: http://illumos.org/msg/ZFS-8000-8A scan: scrub in progress since Wed Oct 23 18:29:14 2013 48.6M scanned out of 321G at 6.95M/s, 13h7m to go 0 repaired, 0.01% done config: NAME STATE READ WRITE CKSUM zfs ONLINE 0 0 0 gptid/b0432b45-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 raidz1-1 ONLINE 0 0 0 gptid/b0b6f615-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 gptid/b12ad6f3-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 gptid/b1aa0cf3-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 errors: 40 data errors, use '-v' for a list |
暫くしてから再度確認してみました
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
; html-script: false ] [root@freenas] ~# zpool status pool: zfs state: ONLINE scan: scrub repaired 0 in 0h14m with 0 errors on Wed Oct 23 18:44:01 2013 config: NAME STATE READ WRITE CKSUM zfs ONLINE 0 0 0 gptid/b0432b45-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 raidz1-1 ONLINE 0 0 0 gptid/b0b6f615-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 gptid/b12ad6f3-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 gptid/b1aa0cf3-3888-11e3-852b-38eaa7a93846 ONLINE 0 0 0 errors: No known data errors |
見事に14分でデータを復旧してデータエラーが無くなりました。ホットスワップみたいで凄い!