FreeBSD 8.2-R + Marvell SATA + AHCI + ZFSはヤバいかも?

この記事は嘘、大げさ、紛らわしい情報を含んでいる可能性が多分にあります。

先日遭遇したZFSのチェックサムエラー、どうもFreeBSD 8.2-RELEASEとMarvellのSATAチップの組み合わせがヤバそうな気がする。

こんな情報も発見 → ahci(4) + zfs chksum error with Marvell SATA controller
チップはちょっと違うが(うちは88SE9128、投稿は88SE9172)、8.2-RでAHCIでZFSでチェックサムエラーというのは、まさにうちと同症状。

投稿者の方に連絡を取ってみたところ、この組み合わせでもFSがUFSだと問題がなく、またSATAコントローラがIntel/AMDのものだとZFSでも問題がないとのこと。うーん、様々な要因が複合的に絡み合ってバグってるぽいなぁ……。

一方で気になるのは、この現象の報告が殆ど無い事。探し方が悪い可能性は否めないが、まとまった情報は↑の投稿くらいしかヒットしない。いやマジで。Marvellチップなんて、SATA、とりわけSATA 3.0ではかなりメジャーなチップな訳で、同症状の人がもうちょい居てもおかしくないと思うのに。

とりあえず、SATAコンを88SE9123、SATAケーブルも3.0対応を謳いシールドもしっかりしてそうなものに替え、FreeBSD 9-BETA 3で環境を再構築した。

今のところチェックサムエラーは出ていない。もっとも、まだ1週間しか経ってないので今後発生する可能性は大いにある。

現象の原因を未確定の状態で不確かな情報を流すのは躊躇われるが、FS絡みの不具合は遭遇した時の精神ダメージが半端ないため、注意喚起という意味で流したいと思う。8.2-Rでは、AHCIを有効にするとMarvellのSATAコン経由でZFS Bootが出来なくなるなど、不安定な点があるのは事実なので。

  • FreeBSD 8.2-RELEASE、MarvellのSATAコントローラ、AHCI、ZFSの組み合わせでチェックサムエラーが発生するっぽい。
  • ZFSでミラーリング構成していても全く同一のブロックでエラーになっているのか、修復は不可能。
  • エラー数は、(プール全体のエラー数)× 2 =(構成HDD1台毎のエラー数)という関係になるっぽい(多少ふらつきがある場合がある)。



  • blog/2011/2011-10-21.1420512696.txt.gz
  • 最終更新: 2015-01-06 11:51
  • by 127.0.0.1