仮想サーバ不調
先日 ESXi ベースに切り替えたこの自宅サーバ。open-vm-tools から謹製 VMware-tools に変更してもやはりフリーズする。2つのゲスト OS のうち、メール(postfix/dovecot) と ウェブ (lighttpd/PHP/MySQL) が載ったゲストだけが不調なので、原因はどれかのサービスとカーネル、VM の相性の問題なのかもしれない。
昨日は1日で2回フリーズした。これでは話にならんので、いっそゲスト OS を変更してみようと思う。試行錯誤。
先日 ESXi ベースに切り替えたこの自宅サーバ。open-vm-tools から謹製 VMware-tools に変更してもやはりフリーズする。2つのゲスト OS のうち、メール(postfix/dovecot) と ウェブ (lighttpd/PHP/MySQL) が載ったゲストだけが不調なので、原因はどれかのサービスとカーネル、VM の相性の問題なのかもしれない。
昨日は1日で2回フリーズした。これでは話にならんので、いっそゲスト OS を変更してみようと思う。試行錯誤。
問題発生中。今、自宅サーバはこんな風に動いている。
[VMware ESXi]HP ProLiant ML115 |-[OpenSUSE 11.1] (VMguest1)DNS/DHCP/OpenVPN |-[OpenSUSE 11.1] (VMguest2)Postfix/Dovecot/lighttpd/MySQL/etc.
ところが、VMguest2 の方が頻繁にフリーズする。ほぼ同じ条件の VMguest1 はなんともなっていないので原因不明。
ESXi のバージョンおよび OpenSUSE 11.1 は最新にしてみたが、だいたい再起動後 20時間ぐらいすると VMguest2 の CPU 使用率が MAX に張り付き、フリーズしてしまう。VI client 越しに ESXi に接続して再起動はできるので、ESX ホストが固まっているわけではない。
ESXi 自体では会社でも使っていて安定動作しているので、ESXi 自体の問題とも考えにくい。ただし、会社で使っているのはほとんどが CentOS 5 か CentOS 4。
気になっていたのは、OpenSUSE 11.1 には open-vm-tools というパッケージがついていて自動インストールされること。通常の VMware 製品群では、VMware 社が提供する vmware-tools というパッケージを組み込むことにより、メモリ管理や I/O アクセス用のドライバが kernel に組み込まれるのだが、open-vm-tools はこれをオープンソース化したものらしい。open-vm-tools 自体も VMware 社が公開しているコードをベースにしているようなので悪くはないような気がするが、他の安定稼働中のマシンと条件が違うのが気になる。
そこで、VMguest2 のほうだけ open-vm-tools を外して謹製 VMware-tools に入れ替えてみることにした。これでもだめなら OpenSUSE 11.1 と ESXi の相性か、カーネルをフリーズさせるほどの何かのサービスが問題になっているのだろうな。フリーズする近辺はなにも /var/log/messages に出ていないので何もわからない。
しばらくこれで様子見。このサイトも不安定が続きそうなのでごめんなさい。
ひどい頭痛のため、この日曜日に予定していた大学時代の友人の結婚披露宴をキャンセルしてしまったので週末は時間が空いてしまった<。金曜日に処方された薬が割と効いているので再挑戦することにした。
結局、既存サーバ環境 (openSUSE 10.3) の VM 化を諦め、新規構築した VM (openSUSE11.1) にデータをコピーしてからちまちまと調整するという、旧態依然とした作業になった。サーバの停止が前提なら、コピーも含めて正味丸2日かければなんとかなる。
xfsdump/xfsrestore を使うことで、ファイルシステムの整合を保ちながら HDD のサイズを変更することが可能になる。ext2/ext3 の場合は dump/restore を使用する。netcat (RedHat 系では nc) が双方にインストールされていれば上記のように簡単だが、ない場合は ssh や rsh を使用することになり、いずれもパフォーマンスが問題であったり設定が面倒等の問題がある。netcat 便利ですね。
ファイル単位なので、LVM なパーティションから LVM なしの環境に抜くこともできる。dd と違って何も書かれていない領域はコピーしない。ただし dump/restore は ext3→ext3、xfsdump/xfsrestore は XFS→XFS というように、同じファイルシステムにしかコピーできない。afio や dar といったツールを使えばいいのかもしれないが、ファイルシステムに密着したダンプツールの方が、正確な権限やアトリビュートを再現できるはず。
さて、この blog サーバは移行後の ESXi 上の OpenSUSE 11.1 VM で動作している。リモートで使用していると、VM であることを意識することはなく快適だ。さすが ESXi。Native で VM が動くというのが実にいい感じだ。
今のところ (B) 機につけた HDD 500GB のうち、 250GB 程度しか割り当てていないので、残りの領域にも他の OS をインストールできる余地がある。評価用の CentOS とか Windows7 beta とかもそのうち入れてみよう。そうなるとメモリが 2GB だと心許ないな。せめて 4GB 程度には増やしたい。
うちのサーバ用に購入した 500GB の Barracuda 7200.11 は、ダメ元でファームウェアのアップデートを実施したところ、SD15 から SD1A にアップデート完了。今のところ問題なく動作している。
メーカーの品質や姿勢には疑問が残るが、なんども再起動を繰り返しても問題がないようなので、このまま使うことにした。とりあえずウチ的には解決、ということで。
処方された緊張型頭痛のため薬が効いたらしく、昨晩から今朝に掛けて頭痛が解消した。
助かった。最初から脳神経外科に相談すれば良かった。結局「偏頭痛じゃなかった」ってことか。
最近のコメント