Vsphereパフォーマンスの低下をトラブルシューティングするためのヒントとコツ

はじめに

他の管理者として、Vmは最終的に中断、パフォーマンスの問題、または単に応答を停止し始めることを知っています。 それは残念ながら、人生の事実です。 仮想化エンジニアとして、これらの問題に少なくとも一度はすでに遭遇している可能性があります。 また、仮想化環境は非常に複雑なシステムであるため、VMのパフォーマンスの低下に影響するさまざまな理由や要因が多すぎる可能性があります。 何が間違っているかを見つけようとすると、多くの時間がかかることがあります。

今日は、VMwareインフラストラクチャがパフォーマンスの低下を引き起こす原因を特定し、それを回避する方法を見つけるために一緒に試してみます。

では、適切なトラブルシューティングには何が必要ですか?

まず、記録。 記録は、vSphere環境の問題を解決する上での聖杯です。 分かってる分かってる もちろん、あなたの記憶を100%信頼し、もちろん、ログインするための資格情報やその他の必要な情報など、知る必要があるすべてを覚えています。 ただし、サーバーが突然故障したり、ESXiホストが過負荷になったりしたときに最後に発生したいのは、ホストまたはvSphere vCenterに入るためだけにパスワードを覚

また、vSphere clusterスキームなどの既存のドキュメントは、大きな助けになる可能性があります。 あなたが本当にシステム全体がどのように構成されているかわからない場合、それはあなたに大きな時間を遅くします。 当然のことながら、世界の誰も実際に記録を保持するのが大好きですが、必要が生じたときに、簡単にアクセスできる情報を持っていることに感謝 それでは、この情報が何から構成されるべきかを見てみましょう:

ESXiホスト:

  • ホスト名/IPアドレス
  • ESXiホストのバージョンとパッチレベル
  • Rootパスワード(保護された場所に保管)
  • ストレージとインターフェイス用の記録IPアドレス
  • ホストハードウェアの説明
  • ストレージ構成(iSCSIなど)
  • ネットワークアダプタ(ベンダー、ドライバのバージョンなど)
  • )

ストレージスイッチ:

  • 使用されているIPアドレス
  • ファームウェアバージョン
  • 資格情報(保護された場所に保管)
  • Vlan設定

ストレージアレイ:

  • SAN管理ポートのIPアドレス
  • ファームウェアレベル
  • LUN構成、RAIDレベル、ドライブ数、サイズ、ドライブファームウェア
  • SANアレイ管理インターフェイスへのロ)

あなたはおそらく今では収集することができますように、より多くの文書、より良い。 悲しいことに、多くの管理者はこのルールを無視する傾向があります。 また、ドキュメントが古くなっている場合はあまり使用されないため、変更に応じて変更に追いつく必要があります。

何から始めるのですか?

1. VMware

からの最高のパフォーマンス慣行を慎重に研究するこの資料は、二年間、重要かつ不可欠です。 最初に、トラブルシューティングのスキームがあります。 考えられる問題は、関連性(VMware Tools、CPUなど)とその範囲(パフォーマンスへの100%の影響から最小限まで)に応じて分類されます。 あなたがそれを使用する場合、それはあなたのインフラストラクチャを改善するために多くのことを助けることができます。

2. VMwareツール?

VMware ToolsがすべてのVmにインストール、アップグレード、および実行されていることを確認してください。 基本的には、VMware Toolsパッケージは、仮想マシンのパフォーマンスに影響を与える仮想デバイスドライバのスイートです(通常はもちろん、より良いものです)。

VMware Toolsのインストールを確認します。

  • vSphere Web Clientでホストを選択します。
  • 仮想マシンタブに移動します。
  • “VMware Toolsステータス”列を追加します。
  • ステータスを確認します。 それはOKと言う場合は、パフォーマンスを向上させるための次の方法を探し始めます。
  • が実行されていない/古くなっている–VMware Toolsをインストールします。VMware Toolsが起動していない場合は、問題が発生する可能性があるため、ゲストOSを修正する必要があります。 これは、Linuxカーネルの更新か、何らかの理由でWindowsのVMware Toolsが無効になっているかのいずれかです。

    現在のVMware Toolsバージョンが古くなっている場合は、vSphere Web Clientコンテキストメニューを使用してアップグレードする必要があります。 通常は、ESX/ESXiホストに最新の更新プログラムをインストールした後に発生します。 これらの作業が完了したら、VMware Toolsも最新の状態に保つことを忘れないでください。 全体的に、vSphere Web Clientを使用すると、次のスキームが示すように、VMwareツールを簡単に確認できます。vSphere Web Client

    vmtoolsの状態がVmの表示されます。
    vmtoolsを追加するには、タイトルの上でマウスの右ボタンをクリックし、それに応じて選択します。

    Vmtoolsステータス
    ただし、vmtoolsパッケージの存在とその現在の状態を確認するPowerCLIシナリオを適用することもできます。 Vmtoolsに関連するプロパティの大部分は、<vm>の下にあります。ゲストエクステンションデータ…

    VMWare PowerCLI For ESXi and vSphere

    PowerCLI for VMware vSphereは、Microsoft PowerShell/PowerCLIをベースにした非常に強力なツールで、コマンドラインから仮想インフラストラクチャを管理するための手動タスクの98%を実行できます。 ツールとして、PowerCLIを使用すると、コマンドラインでESXiおよびvCenter Serverの運用管理を一元化できます。 この素晴らしいユーティリティのおかげで、シナリオを作成し、Vm、ストレージ、ネットワーク、ユーザーアカウントの状態を監視し、ケーキの上の桜は、操作プロセスの大部分を自動化することができます。 Microsoft Windows7/Windows Server2008R2以降を搭載したマシンにPowerCLIをインストールできますが、さらに興味深いのは、さまざまなLinuxキット用のいくつかのバージョンがあります。

    PowerCLIは、クラウドおよび仮想VMwareインフラストラクチャ(vSphere、vSAN、vRealize Operations Manager、vCloud Director、Site Recovery Manager、Horizon7、およびvCloud Air)を管理するための1900以上のコマンドレットで構成されています。 コマンドレットを実行するときは、選択したESXiホストまたはvCenter Server上のAPIをアドレス指定します。 良いニュース:VMwareの公式サイトからVMware PowerCLIの最新パッチをダウンロードできます(もちろん、そのためのアカウントが必要です)。 PowerCLIコンソールを使用するには、管理者としてVMWare VSphere PowerCLI shortcutを起動するだけです。 PowerCLIコンソール

    基本的な問題

    1. VMのリソースが不足している

    確かに、VMが効率的に実行するのに十分なリソースを持っていることは必須です。 ただし、ゲストOSの要件とその下で実行されているアプリケーションに応じて、十分なリソースが割り当てられていないVmの数には衝撃を受けます。 つまり、仮想化がテーブルにもたらす無数の利点にもかかわらず、常に競合するオーバーヘッドがあることをあなたの手の甲のように知っておくべきです。 RAMが不足した場合、VMは何をしますか? 当然のことながら、マシンはディスクへのスワップをはるかに頻繁に開始します。 基礎となるストレージがいっぱいの場合、パフォーマンスは大きな打撃を受けます。 そのため、そうする機会があるときはいつでも、予約、リソースプール、DRSなどを使用して、運用効率を最大限に高めるために適切な量のリソースがVMに割り当て

    2. パフォーマンス監視

    基本的に、パフォーマンス監視はvSphereクライアントに組み込まれた機能です。 これは、パフォーマンス関連の問題を調べるのに役立つ必要なツールの1つです。 それはあなたが可能な限りアラームを使用することができますので、それはとても良いですので、あなたは常に一歩先に任意のパフォーマ Vmware ESXi

    ただし、ローカルESXiホストで作業している間は、[Performance]タブにのみアクセスできることに注意してください。 詳細が必要な場合は、VMware®vSphere vCenterを使用します。 VMware®vSphere vCenter非常に重要です。 性能および高度の性能は有効で、報知的な診察道具より多くです。 あなたがそれを正しく使用すれば、あなたはあなたのシステムの柔らかい場所を見つけるのに問題がないでしょう。

    リソースプールのCPU飽和を例に取ってみましょう。 詳細を調べるには:

    • “リソースプール”を選択し、”パフォーマンス”に移動します。 次に、Advancedに切り替えてCPUオブジェクトを選択します。
    • 現在の飽和をMHz単位で評価します(使用量)。
    • リソースプールの制限の値と現在の飽和を比較します。 制限に近い場合は、リソースが不足している可能性があり、必要なことは、このプール内の個別のVmのCPU ready値を再評価することだけです;

    CPU対応検証:

    • 準備ができたCPUのため。 VMを選択し、パフォーマンスに移動し、詳細モードを選択し、”CPU”のレビューに切り替えます(特定のVMのパフォーマンスのトラブルシューティングを行う場合は、そ “オブジェクト”は、VMの別の仮想プロセッサです。 “チャートオプション…”のプロパティを変更する必要があります。
    • 教えてください、任意の仮想プロセッサの最小または平均準備値は2000msを超えていますか? もしそうなら、いつ、それは今すべて明らかです。 リソースプールに制限が設定されているため、プロセッサリソースが不足しているだけです;
    • ここで、このプール内の残りのVmについても同じことを行います。

    ホストCPU飽和の検証:

    • ホストを選択し、パフォーマンスに移動し、詳細モードに切り替えて、”CPU”オブジェクトを選択します。
    • 現在の飽和をMHzで評価します(使用量)。
    • 75%を超えていますか、 もしそうなら、おそらく、あなたはホストプロセッサリソースが不足しています。 以下のように、このホスト上のVMのCPU準備ができていることを確認します。 中央プロセッサの平均彩度が75%を超えない場合、次はあなたが見ることです!

    :

    • 特定のVMのパフォーマンスのトラブルシューティングを行う場合は、まずそのVMから始めます。 それ以外の場合は、ホストを選択し、仮想マシンに移動し、ホストCPU—MHz(列から列へ)のようにリストを並べ替え、リストの先頭から一つまたは二つのVmを見てみましょう。
    • CPUレディを測定するには、VMを選択し、パフォーマンスに移動し、詳細モードに切り替えてから”CPU”のレビューに切り替えます(特定のVMのパフォーマンスのトラブルシューティングを行う場合は、そのvmから開始します)。
    • すべてのVMの”オブジェクト”のレディを評価します。 “オブジェクト”は、VMの別の仮想プロセッサです。 “チャートオプション…”のプロパティを変更する必要があります。
    • 仮想プロセッサの最小値または平均準備値は2000msを超えていますか? その場合は、ホストプロセッサのリソースが不足しています。

    検証が必要な潜在的に問題のあるパラメータ:

    • ゲストCPU飽和検証;
    • アクティブVMメモリスワップ検証;
    • VMスワップ待機検証;
    • VMメモリ圧縮検証;
    • オーバーロードされたストレージデバイス検証;
    • 受信パケット検証の削除;
    • 送信パケット検証の削除;
    • SMP VM検証のvCPU1つ;
    • 平均負荷検証のホストでVM CPUの準備ができている;
    • 低速または過負荷検証;
    • 低Vmプロセッサ飽和検証;
    • 過去のVmメモリスワップ検証;
    • 高リソースプールのメモリ需要検証;
    • 高ホストメモリ需要検証;
    • 高いゲストメモリ需要の検証;
    • 高いタイマ割込みレートの検証;
    • NUMA設定の検証;
    • 高いVMスナップショット応答時間の検証;

    ディスクサブシステムの問題

    要するに、ストレージシステムの問題を

    1に絞り込むことができます。 ストレージシステムが過負荷になっている;

    • ストレージシステムが過負荷になる理由は何ですか? まあ、主なものは、間違った構成(デバイスの量と種類/RAIDレベル/キャッシュ/など)であろうと、非常に高い負荷であろうと、非常に簡単です。
      普遍的な解決策はないので、私はちょうど私のキャプテン明白な制服を着て、おそらくすでに知っているものをリストダウンするつもりです:
    • パフォーマesxtop–Vmwareコンソールツールは、ストレージのパフォーマンスを監視するのに適しています。 Sshセッションにログインして開始します。 Resxtopを使用する傾向がある人のために:Linux用のvMAまたはvSphere CLIをダウンロードし、そこからこのツールを起動する必要があります。 しかし、公平を期すために、最後のバージョンは、それがESXとESXiの両方で動作するための普遍的です。
    • また、華麗なvSCSIStatsユーティリティがあります。
      ストレージシステムが非常に遅い動作している理由を疑問に思っている場合は、FIO合成負荷でそれを把握することができます。
      特定のアプリケーションでは、より多くのメモリを提供すると、ディスクオーバーヘッドを下げることができることに注意してください。

    2.
    基本的には、上記のリストからすべてを行います!

    3. 3単純なソリューション:

    共有;
    制限IOPS;
    輻輳しきい値(ストレージIO制御)。

    4. Bad disks;
    ディスク/ネットワークストレージを定期的にチェックし、何かが失敗したり、古くなったりした場合は、すぐに交換してください。 しかし、あなたは、いくつかのケースでは、ディスクが失敗した場合は特に、(RAIDメモリの追加使用)チェックを開始すると、同じ運命に他のディスクを持って来ることができることを知っている必要があります=運命全体のRAID。

    5. ESXi OS;
    ESXiホストOS、スワップパーティション、およびローカルデータストアに存在するVmには、別々のディスクを使用します。 また、RAIDを使用して読み取りと書き込みのパフォーマンスを向上させることも検討してください。

    6. Snapshots;
    未使用または冗長なスナップショットを削除します。 スナップショットが多いほど、I/Oアクティビティに伴うディスクオーバーヘッドが大きくなることを今では知っておく必要があります。

    7. 暗号化;
    必要な場合にのみディスク暗号化を使用してください! 暗号化はオーバーヘッドにつながり、オーバーヘッドはパフォーマンスの低下につながり、私たちはそれを望んでいませんか?

    (詳細に興味がある場合は、自分で調べることを歓迎します)

    小さなヒント

    環境をより深く評価するためのvRealize Operations Managerの展開

    このVrealize Operations Managerは、VMware vSphere仮想インフ ベンダーは、統合された作業のトラブルシューティングを約束しました。 ここからダウンロードできます。

    自分自身に質問してください:VMは本当に奇妙な動作をしていますか?

    負荷が大きいVMは、パフォーマンスが低下しているように見えることがあります。 たとえば、SQLサーバーの仮想化インスタンスや不十分に書かれたSQLクエリは、あなたのパフォーマンスの大きな時間を遅くすることができます! 大規模なユーザーベースを持つメールサーバーは、この点でも少し問題になる可能性があります。 幸いなことに、vSphere Web clientのパフォーマンス監視チャートは、特定の期間内のリソース使用率を測定するのに役立ち、問題のある動作が一度だけのものであるか、進行中であるかどうかを確認し、そのような状況下で期待されているかどうかを判断できます。 MS SQLとExchange Serverは、特に動的メモリ割り当てが構成されている場合、見つけることができるVMのゲストOSからRAMを占有しています。

    Analyze I/O Workloads to Determine Storage Performance Requirements

    最新の更新と最新バージョン

    更新と最新リリースは、修正されたバグ、改善されたドライバ、およびコードによるパフォーマンスの問題に対処することが それにもかかわらず、この1つの私を信頼しなさい;時々、最も最近の解放はそれをより悪くさせる! だから心配して、あなたが確信するまでテストしてください。 または、少なくとも他の人が試してみて、それに取り組んでみましょうので、あなたは考え抜かれた決定を下すことができます。

    ウイルス対策ソフトウェアESXi

    ユニコーンにぶつかる可能性は大きいですが、実際にはESXi(vShield)上で実行されているウイルス対策ソフトウェアを見つけることができる場合があります。 このようなことは、正しく構成されていない場合、複数の方法でVMのパフォーマンスに深刻な影響を与える可能性があることをさらに説明する必 また、その小さなフットプリントと作り付けのセキュリティ機能のためにESXi上でウイルス対策ソフトウェアを実行する理由がないことを覚え マルウェア対策ソフトウェアをVMのゲストOSに降格する方がはるかに優れていることをお勧めします。 ESXiにAVをインストールする必要がある場合は、特にピーク使用時間中に、VmdkなどのVMファイルをスキャンスケジュールから除外するようにしてください。

    CPU電源管理は有効ですか?

    Cpu電源管理は、ESXiサーバー上で有効になっている場合、速度の遅延につながる可能性があり、アプリケーションやワークロードによって取得される可能性があ これが問題の根本であると思われる場合は、CPU電源管理の無効化に関するベンダーのドキュメントで確認する必要があります。 効果がゼロの場合は、再度有効にして、数回ヘルスチェックを行います(詳細はこちら)

    BiosおよびSCSIコントローラ用の電源バッテリー

    ESXiホストのBiosサブシステム用の電源バッテリーを確認します(仕様で許可されている場合は、SCSIまたは他のコントローラ用も確認してください)。 SCSIキャッシュは、多くの場合、作業のために追加の電力を必要とし、コントローラボード上の電源バッテリは、通常、それを提供します。 仕様はバックアップ電源計画であると主張していますが、電源バッテリの低電圧がコントローラの作業に間違いを招くことがわかり、交換のみで直

    最後にアドバイスのいくつかの作品:

    • iSCSIスイッチ、ネットワーク、光ケーブルなど、ストレージシステムのすべての物理アーキテクチャのヘルスチェックを行います。
    • スイッチのログをチェックして、ストレージシステムやデバイス自体にエラーやその他の不幸なイベントが発生していないことを確認します。
    • iSCSIへの接続に問題がないことを確認するために、vmkernelアドレスからiSCSIにPingを実行します。
    • SAN自体のヘルスチェックを実行します–障害が発生したディスク、ストレージコントローラーフェールオーバーイベント、またはパフォーマンスに影響を与える可能性のあるその他の間違いがないことを確認してください。
    • ESXiホストに接続されているすべてのLUNの空きディスク領域を確認します。

    結論

    私は知っている、VMware vSphere ESXiのトラブルシューティングは少し怖い見ることができます。 ただし、正確なドキュメント、インフラストラクチャの十分な理解、およびいくつかの効率的な組み込みツールを使用すると、Vmを悩ませている問題を ちょうど一瞬停止し、正確にどこに、どのような問題があるかを考えて、システムのどの部分がトラブルを引き起こしているかを把握します。 必要が生じた場合、ユーティリティ、コマンドラインESXTOP、esxcli、そして最後にvRealize Operations Managerがあなたを助けることができることを願っています。 また、VMwareまたはベンダーの技術サポートに助けを求めることを躊躇しないでください。 非常に頻繁に、彼らはあなたがそれを驚くほど速く修正するのを助けることができます。

Leave a Reply