VMware スナップショット、Sync Driver(LGTO_Sync)の問題


VMware スナップショットのファイルシステム停止方法

VMwareのスナップショット技術で、仮想マシン(Windows)のファイルシステム停止する方法は二つある。
二つともファイルシステムを停止する仮想マシン上のWindowsゲストOS上で動作するサービスです。
  • Sync Driver (LGTO_Sync)
    Windows 2000 Server 以降で使用可能
    ユーザーモードで動作

  • VSS (Volume Shadow copy Service)
    Windows Server 2003 以降で使用可能
    OS 標準機能
その他Windows NTとかLinux等の仮想マシンは、ファイルシステムの停止をするサービスは用意されていない。

「ファイルシステム停止」とは稼動するゲストOSで、メモリ上のファイルシステムキャッシュをディスクへフラッシュした状態を示す。
VMware 社のSync Driver でも、NTFSの整合性保障をしている。


Sync ドライバの問題点

VMware Tools で提供されていた Sync Driver(LGTO_Sync)はユーザーモードで動作するため、カーネルモードのディスク I/O を静止する権限を持ちません。
この製品仕様上の制限により、Sync Driver がファイルシステムの静止を試みたタイミングでカーネル モードのディスク I/O が発生していた場合、Sync Driver はファイルシステムの静止に部分的に失敗します。

VMware ESX がスナップショットの作成をタイムアウトさせるまで、.仮想マシン(ゲストOS)上で一部の I/O だけが停止された状態が続く場合があります。

具体的には、
VCB(VMware Consolidated Backup)を使用しVirtualCenter から仮想マシンへスナップショット命令を出した場合、VirtualCenter のスナップショット処理待ちタイムアウトは15分になります。
スナップショット処理タイムアウトの15分まで、スナップショット処理中のオンライン仮想マシンはハングした状態になる場合があります。
(一部I/O停止(ユーザーモードI/O停止)なので、ゲストOSがどのようなハング状態になるかはわかりません)


仮想マシンの症状

上記、例では19:00~19:15、19:20~19:35と、スナップショットタイムアウト時間15分の間を二回仮想マシンがハングしたような状況が出来た時のVMware 上(VIクライアント上)でのDiskパフォーマンスデータとなります。
Disk Write Request が0を15分も続けているのに、vCenterでスナップショットタイムアウトとなり、さらにvCenterでスナップショットタイムアウトになった直後にVMware ESX側でスナップショット処理が完了するという不思議な現象のVMwareからみたディスクIO状態を示します。
不思議で、納得いきませんがVMwareからどうしようも出来ないという解答を得ていて、Syncドライバを使用する限り解決不可能な状態です。
仮想マシン(ゲストOS)の動作と言いますと、ディスクIOが発生しないと思われるPingは通る場合と通らない場合があります。今回の場合はPingは反応しました。しかしファイルサーバーのWindows認証を行ったところ

d:\>net use \\fileserver\IPC$ /user:admiistrator
システム エラー 67 が発生しました。

ネットワーク名が見つかりません。
とサービス自体は反応しない状態が続きました。

またVIクライアントから対象仮想マシンにコンソール接続した場合は、スナップショット作成中なので、当然のように15分間仮想マシン画面に接続できません。(VMwareスナップショット作成ロジック上)

VCB(VMware Consolidated Backup)のスナップショットタイムアウト

VCB(VMware Consolidated Backup)を利用した場合、VirtualCenterのスナップショット処理待ちタイムアウトは15分になります。
このスナップショット処理待ちタイムアウト時間内に
  1. ゲストOS上でのpreスクリプト実行
  2. Syncドライバによるファイルシステム停止
  3. スナップショットの作成
  4. ゲストOS上でのpostスクリプト
が実行されなければなりません。
タイムアウト時間になりますと、VirtualCenterからVMware ESXに対しスナップショット処理キャンセル命令が飛びます。
スナップショット処理キャンセル命令では、スナップショットが削除されるクリーン処理が走りますが、タイミングによりクリーン処理が処理されずスナップショット残骸が残る場合があります。

また、手動でVIClient上でのVMwareスナップショットやVMware ESX上でのスナップショットを実行した場合はタイムアウトはありません。


 

サブページ リスト

作成日:
更新日:2010/06/23
Comments