ターミナルが応答しなくなるほどZFSが超遅くなる謎現象

2011年にZFSを使い始めてから早4年、小規模なファイルサーバ運用ではまず困る事がないくらいにはZFSの扱いには慣れたが、未だ解決できていない問題が1つある。 システムが応答しなくなるほど、ZFSへのアクセスが遅くなる現象である。

ハッキリとした発生条件は未だ掴めていないが、概ね以下の条件を満たすと発生する。

  • 良い感じに使い古されたプール(断片化が進んでる状態?)
  • プールの空き容量が少ない
  • 幾つかの書き込みを同時に行う(ブラウザで2〜3個同時にダウンロードするなど)

問題の状態になると、ターミナルで入力が困難になるほどシステムの応答性が低下する。記憶があいまいだが、ロードアベレージ的には特に問題ない値だったハズ。

尚、プールの種類に関係なく発生するっぽい……といっても、ミラーとRAID-ZとRAID-Z+0でしか使った事はないが、何れでも発生している。途中マシン&HDDが変わったり、OSもFreeBSD 8.2→9.0→9.2と更新してるので、特定のハード&ソフトが関係する問題でもないと思われる。まぁ、FreeBSDのZFS実装がタコい可能性もないとは言い切れないが、本家以外のZFSでは老舗の部類に入る実装で、流石にそれはないだろう。

何となくだけど、断片化の線が怪しいんじゃないかなと。というのも、先だって遭遇したプールでは800GB中360GBが未使用だったから空き容量が原因とは考えにくい。ただし、以前、空き容量が100GBを割った事があり、FSの状態としてはそこそこ劣化していると考えられる。また、激遅ゾーン?を抜けるとまた普通の速度に戻るので、書き込もうとしてる領域の状態が悪いとダメっぽい気がする。

で、先日、ようやっと原因究明の糸口になりそうなデータが取れた。

この症状が発生している時は、書き込みしているにもかかわらず、なぜか物凄い読み込みが発生している。以下、zpool iostatのログ。

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    501     48  62.6M   210K
  mirror     491G   357G    501     48  62.6M   210K
    ada3p4      -      -    238     10  29.7M   210K
    ada1p4      -      -    263      7  32.9M   166K
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    451     25  56.4M   111K
  mirror     491G   357G    451     25  56.4M   111K
    ada3p4      -      -    237      4  29.7M   111K
    ada1p4      -      -    213      0  26.7M      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    289      0  36.0M      0
  mirror     491G   357G    289      0  36.0M      0
    ada3p4      -      -    133      0  16.6M      0
    ada1p4      -      -    155     13  19.4M   154K
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    273      0  33.9M      0
  mirror     491G   357G    273      0  33.9M      0
    ada3p4      -      -    135      0  17.0M      0
    ada1p4      -      -    137      0  16.9M      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    375     48  45.7M   313K
  mirror     491G   357G    375     48  45.7M   313K
    ada3p4      -      -    185     18  22.5M   313K
    ada1p4      -      -    189     13  23.2M   475K
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    321      0  39.8M      0
  mirror     491G   357G    321      0  39.8M      0
    ada3p4      -      -    160      0  19.8M      0
    ada1p4      -      -    161      0  19.9M      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    423     25  53.0M   317K
  mirror     491G   357G    423     25  53.0M   317K
    ada3p4      -      -    205      8  25.7M   317K
    ada1p4      -      -    217      4  27.2M   158K
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    432     12  53.9M   158K
  mirror     491G   357G    432     12  53.9M   158K
    ada3p4      -      -    223      4  28.0M   158K
    ada1p4      -      -    208      8  25.9M   317K
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    204      0  25.0M      0
  mirror     491G   357G    204      0  25.0M      0
    ada3p4      -      -    103      0  12.8M      0
    ada1p4      -      -    100      0  12.3M      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    370     25  45.7M   317K
  mirror     491G   357G    370     25  45.7M   317K
    ada3p4      -      -    176     12  21.7M   333K
    ada1p4      -      -    194     10  24.0M   321K
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    380     46  47.2M   305K
  mirror     491G   357G    380     46  47.2M   305K
    ada3p4      -      -    209      6  25.9M   305K
    ada1p4      -      -    170     63  21.3M  7.07M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    199    119  24.4M  7.07M
  mirror     491G   357G    199    119  24.4M  7.07M
    ada3p4      -      -     96     63  11.7M  7.07M
    ada1p4      -      -    102      1  12.8M  23.8K
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    334      0  40.9M      0
  mirror     491G   357G    334      0  40.9M      0
    ada3p4      -      -    148      0  18.1M      0
    ada1p4      -      -    186      0  22.8M      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    401      9  49.7M  39.6K
  mirror     491G   357G    401      9  49.7M  39.6K
    ada3p4      -      -    190      2  23.3M  39.6K
    ada1p4      -      -    211      2  26.4M  47.5K
----------  -----  -----  -----  -----  -----  -----

正常な時はこんな感じ。

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0    402      0  32.3M
  mirror     491G   357G      0    402      0  32.3M
    ada3p4      -      -      0    324      0  32.3M
    ada1p4      -      -      0    323      0  32.3M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0      0      0      0
  mirror     491G   357G      0      0      0      0
    ada3p4      -      -      0      0      0      0
    ada1p4      -      -      0      0      0      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0    195      0  24.3M
  mirror     491G   357G      0    195      0  24.3M
    ada3p4      -      -      0    195      0  24.3M
    ada1p4      -      -      0    195      0  24.3M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0    212      0  8.56M
  mirror     491G   357G      0    212      0  8.56M
    ada3p4      -      -      0    116      0  8.57M
    ada1p4      -      -      0    120      0  8.57M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0      0      0      0
  mirror     491G   357G      0      0      0      0
    ada3p4      -      -      0      0      0      0
    ada1p4      -      -      0      0      0      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0      0      0      0
  mirror     491G   357G      0      0      0      0
    ada3p4      -      -      0      0      0      0
    ada1p4      -      -      0      0      0      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0    402      0  32.3M
  mirror     491G   357G      0    402      0  32.3M
    ada3p4      -      -      0    317      0  32.3M
    ada1p4      -      -      0    318      0  32.3M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0      0      0      0
  mirror     491G   357G      0      0      0      0
    ada3p4      -      -      0      0      0      0
    ada1p4      -      -      0      0      0      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0      0      0      0
  mirror     491G   357G      0      0      0      0
    ada3p4      -      -      0      0      0      0
    ada1p4      -      -      0      0      0      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0    405      0  32.3M
  mirror     491G   357G      0    405      0  32.3M
    ada3p4      -      -      0    323      0  32.3M
    ada1p4      -      -      0    323      0  32.3M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0      0      0      0
  mirror     491G   357G      0      0      0      0
    ada3p4      -      -      0      0      0      0
    ada1p4      -      -      0      0      0      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0      0      0      0
  mirror     491G   357G      0      0      0      0
    ada3p4      -      -      0      0      0      0
    ada1p4      -      -      0      0      0      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0    402      0  32.3M
  mirror     491G   357G      0    402      0  32.3M
    ada3p4      -      -      0    320      0  32.3M
    ada1p4      -      -      0    322      0  32.3M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G    111    128  13.9M  16.0M
  mirror     491G   357G    111    128  13.9M  16.0M
    ada3p4      -      -     50    128  6.31M  16.0M
    ada1p4      -      -     61    128  7.56M  16.0M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0      0      0      0
  mirror     491G   357G      0      0      0      0
    ada3p4      -      -      0      0      0      0
    ada1p4      -      -      0      0      0      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        491G   357G      0    385      0  17.1M
  mirror     491G   357G      0    385      0  17.1M
    ada3p4      -      -      0    203      0  17.1M
    ada1p4      -      -      0    203      0  17.1M
----------  -----  -----  -----  -----  -----  -----

どちらもdd if=/dev/zero of=~/tempした時のiostatだが、問題の方は何故かフルスピードで読み込みが走っている。コマンドを間違えたなんて事は勿論、同時並行で別の読み込みプロセスが走ってるという事もない。読み込んだデータはどこに行っているのか……。

ちなみに、ddしつつ読み込みを行い正常な時はこんな感じ。読み込みと書き込みが仲良く同居してる感じですな。

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    346     41  43.3M  2.19M
  mirror     474G   374G    346     41  43.3M  2.19M
    ada3p4      -      -    167     21  20.9M  2.19M
    ada1p4      -      -    179     48  22.4M  4.68M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    125    165  15.7M  3.03M
  mirror     474G   374G    125    165  15.7M  3.03M
    ada3p4      -      -     52     55  6.56M  3.05M
    ada1p4      -      -     73     30  9.16M   562K
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    139      0  17.3M      0
  mirror     474G   374G    139      0  17.3M      0
    ada3p4      -      -     71      0  8.76M      0
    ada1p4      -      -     68      0  8.54M      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    249    101  29.4M  3.31M
  mirror     474G   374G    249    101  29.4M  3.31M
    ada3p4      -      -    139     35  16.3M  3.31M
    ada1p4      -      -    109     36  13.0M  3.35M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    115    199  12.7M  1.44M
  mirror     474G   374G    115    199  12.7M  1.44M
    ada3p4      -      -     70     51  8.07M  1.45M
    ada1p4      -      -     45     49  4.61M  1.42M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    206      0  25.1M      0
  mirror     474G   374G    206      0  25.1M      0
    ada3p4      -      -    113      0  13.8M      0
    ada1p4      -      -     93      0  11.4M      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    275    260  34.3M  3.81M
  mirror     474G   374G    275    260  34.3M  3.81M
    ada3p4      -      -    153     93  19.0M  3.81M
    ada1p4      -      -    121     87  15.2M  3.81M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    258      0  31.7M      0
  mirror     474G   374G    258      0  31.7M      0
    ada3p4      -      -    123      3  15.1M  15.8K
    ada1p4      -      -    134      3  16.6M  15.8K
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    269      0  32.9M      0
  mirror     474G   374G    269      0  32.9M      0
    ada3p4      -      -    132      0  15.9M      0
    ada1p4      -      -    136      0  17.1M      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    402    100  50.4M  2.41M
  mirror     474G   374G    402    100  50.4M  2.41M
    ada3p4      -      -    189     24  23.6M  2.41M
    ada1p4      -      -    213     24  26.7M  2.41M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    372    124  46.5M   535K
  mirror     474G   374G    372    124  46.5M   535K
    ada3p4      -      -    182     28  22.8M   550K
    ada1p4      -      -    190     28  23.7M   550K
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    339      0  42.4M      0
  mirror     474G   374G    339      0  42.4M      0
    ada3p4      -      -    163      0  20.4M      0
    ada1p4      -      -    176      0  22.0M      0
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    387     55  48.4M  1.66M
  mirror     474G   374G    387     55  48.4M  1.66M
    ada3p4      -      -    203     16  25.5M  1.66M
    ada1p4      -      -    183     18  22.9M  1.68M
----------  -----  -----  -----  -----  -----  -----

               capacity     operations    bandwidth
pool        alloc   free   read  write   read  write
----------  -----  -----  -----  -----  -----  -----
zhome        474G   374G    234    130  29.3M   558K
  mirror     474G   374G    234    130  29.3M   558K
    ada3p4      -      -    111     35  14.0M   574K
    ada1p4      -      -    122     33  15.3M   550K
----------  -----  -----  -----  -----  -----  -----

断片化実験してみりゃいいんだろうけど、問題の性質上、仮想マシンではダメだろうし、かといって個人の趣味では実環境を揃えるのもなかなか大変だし(とか言いつつ、実はパーツは揃ってたりするが面倒&時間がなくて実験出来てない…)

何でこんな事が起きるのか、偉い人教えて下さい……。




  • blog/2014/2014-10-30.txt
  • 最終更新: 2015-01-06 11:51
  • (外部編集)