tipy a triky pro řešení špatného výkonu vSphere

Úvod

jako každý jiný administrátor víte, že VM nakonec začnou trpět poruchami, problémy s výkonem nebo jednoduše přestanou reagovat. To je bohužel fakt života. Je pravděpodobné, že jako virtualizační inženýr jste se s těmito problémy pravděpodobně setkali alespoň jednou. A protože virtualizované prostředí je poměrně komplikovaný systém, může existovat příliš mnoho různých důvodů nebo faktorů, které ovlivňují špatný výkon VM. Snažit se zjistit, co je špatně, může trvat hodně času.

dnes se společně pokusíme zjistit, co může způsobit, že vaše infrastruktura VMware rozdá špatný výkon, a najít způsoby, jak se tomu vyhnout.

Takže, co budete potřebovat pro správné řešení problémů?

Za prvé, záznamy. Záznamy jsou svatým grálem při řešení problémů prostředí vSphere. Já vím, já vím. Samozřejmě důvěřujete své paměti 100% a samozřejmě si budete pamatovat vše, co potřebujete vědět, jako přihlašovací údaje nebo jiné potřebné informace. Nicméně, poslední věc, kterou chcete, aby se stalo, když váš server náhle selže nebo vaše ESXi hostitelé jsou přetíženi je nervózně snaží zapamatovat hesla jen pro vstup hostitele nebo vSphere vCenter.

také jakákoli existující dokumentace, například vSphere cluster schemes, může být velkou pomocí. Pokud opravdu nevíte, jak je celý systém nakonfigurován, zpomalí vás to. Přirozeně, žádná osoba na světě ve skutečnosti miluje vést záznamy, ale věřte, když to bude potřeba, budete vděční za to, že máte snadno dostupné informace. Nyní se podívejme na to, z čeho by se tato informace měla skládat:

ESXi hosts:

  • názvy hostitelů / IP adresy
  • ESXi hostitelská verze a úroveň opravy
  • kořenové heslo (udržujte jej na zabezpečeném místě)
  • zaznamenané IP adresy pro úložiště a rozhraní
  • popis hardwaru hostitele
  • konfigurace úložiště (iSCSI atd.)
  • Síťové adaptéry (prodejce, verze ovladače atd)

úložné spínače:

  • použité IP adresy
  • verze firmwaru
  • pověření (udržujte je v zabezpečeném umístění)
  • nastavení Vlan

Storage Array:

  • IP adresa portu pro správu SAN
  • úroveň firmwaru
  • konfigurace LUN, úroveň RAID, počet jednotek, velikosti, firmware jednotky
  • přihlášení a hesla k rozhraní pro správu San array
  • nástroje pro správu San specifické pro dodavatele (specifické nástroje)

jak už asi můžete shromáždit, čím více dokumentace, tím lépe. Bohužel, mnoho administrátorů má tendenci toto pravidlo ignorovat. Také vaše dokumentace nebude moc užitečná, pokud je zastaralá, takže musí držet krok se změnami, jak jdou.

co začít?

1. Pečlivě prostudujte nejlepší výkonnostní postupy od VMware

tento materiál zůstává kritický a životně důležitý po dobu dvou let. Na začátku je schéma řešení problémů. Možné problémy jsou řešeny podle jejich relevance (VMware Tools, CPU atd.) a jejich rozsahu (od 100% vlivu na výkon až po minimální). Pokud jej používáte, může vám to hodně pomoci zlepšit vaši infrastrukturu.

2. VMware Tools?

ujistěte se, že nástroje VMware jsou nainstalovány, upgradovány a spuštěny na každém z vašich virtuálních počítačů. Balíček VMware Tools je v podstatě sada ovladačů virtuálních zařízení, které ovlivňují výkon virtuálního počítače(samozřejmě k lepšímu).

ověřte instalaci nástrojů VMware.

  • Vyberte hostitele ve webovém klientovi vSphere;
  • přejděte na kartu virtuální stroje;
  • přidejte sloupec “Stav nástrojů VMware”;
  • Zkontrolujte stav. Pokud se říká OK, začněte hledat další způsob, jak zlepšit výkon.
  • není spuštěn / zastaralý-nainstalujte nástroje VMware.

pokud se nástroje VMware nespustí, budete muset opravit hostující operační systém, protože tam může být problém. Je to buď Aktualizace jádra Linuxu, nebo někdo z nějakého důvodu měl nástroje VMware v systému Windows zakázány.

pokud je vaše aktuální verze VMware Tools zastaralá, musíte provést upgrade pomocí kontextové nabídky webového klienta vSphere. Obvykle se to stane po instalaci nejnovějších aktualizací na hostitele ESX/ESXi. Až s nimi skončíte, nezapomeňte také aktualizovat nástroje VMware. Celkově můžete s webovým klientem vSphere snadno zkontrolovat nástroje VMware, jak naznačuje následující schéma: webový klient vSphere

zobrazení stavu vmtools pro VMs.
vmtools můžete přidat kliknutím pravým tlačítkem myši na název a odpovídajícím způsobem jej vybrat.

 stav Vmtools
můžete však také použít scénář PowerCLI, který kontroluje přítomnost balíčku vmtools a jeho aktuální stav. Většina vlastností souvisejících s vmtools se nachází pod <vm>.host.extensiondata.

VMWare PowerCLI pro ESXi a vSphere

PowerCLI pro VMware vSphere je neuvěřitelně výkonný nástroj založený na Microsoft PowerShell / PowerCLI umožňuje provádět 98% ručních úkolů pro správu virtuální infrastruktury z příkazového řádku. Jako nástroj umožňuje PowerCLI centralizovat Provozní správu serveru ESXi a vCenter v příkazovém řádku. Díky tomuto nádhernému nástroji můžete vytvářet scénáře, sledovat stav virtuálních počítačů, úložiště, sítí, uživatelských účtů a třešničkou na dortu automatizovat většinu provozních procesů. PowerCLI můžete nainstalovat na počítače s Microsoft Windows 7 / Windows Server 2008 R2 a vyšší,ale co je zajímavější, existuje několik verzí pro různé sady Linux.

PowerCLI se skládá z více než 1900 rutin pro správu cloudové a virtuální infrastruktury VMware (vSphere, vSAN, vRealize Operations Manager, vCloud Director, Site Recovery Manager, Horizon 7 a vCloud Air). Při provádění rutiny adresujete rozhraní API na vybraném hostiteli ESXi nebo serveru vCenter. Dobrá zpráva: nejnovější opravu VMware PowerCLI si můžete stáhnout z oficiálních stránek VMware (ano, samozřejmě budete potřebovat účet). VMware PowerCLI Chcete-li pokračovat v konzole PowerCLI, stačí spustit zástupce VMWare vSphere PowerCLI jako správce. PowerCLI console

základní problémy

1. Nedostatek zdrojů pro VM

vím, vím, je pravda, že mít dostatek zdrojů pro efektivní výkon VM je nutností. Byli byste však šokováni, kolik VM není přiděleno dostatečných zdrojů podle požadavků hostujícího OS a aplikací, které jsou pod ním spuštěny. Myslím, měli byste to vědět jako zadní část ruky, že navzdory nespočetným výhodám virtualizace přináší ke stolu, vždy existují režijní náklady, se kterými se můžete potýkat. Jako, co bude VM dělat, když dojde paměť RAM? Vaše zařízení se přirozeně začne vyměňovat na disk mnohem častěji. Pokud je základní úložiště plné, výkon utrpí obrovskou ránu. Proto, kdykoli máte šanci tak učinit, použijte rezervace, fondy zdrojů, DRS a vše, co můžete, abyste se ujistili, že správné množství zdrojů je přiřazeno VM pro maximální provozní efektivitu.

2. Monitorování výkonu

sledování výkonu je v zásadě funkce zabudovaná do klientů vSphere. Tenhle tady je jedním z těch nezbytných nástrojů, které vám pomohou prozkoumat problémy související s výkonem. Je to tak dobré, protože vám umožňuje používat alarmy všude tam, kde je to možné, takže jste vždy o krok napřed před jakýmkoli problémem s výkonem. Vmware ESXi

Mějte však na paměti, že při práci na místním hostiteli ESXi se můžete dostat pouze na kartu Výkon. Pokud chcete více podrobností, použijte VMware® vSphere vCenter. VMware® vSphere vCenterSUPER důležité. Výkon a pokročilý výkon jsou více než efektivní a informativní diagnostické nástroje. Pokud jej používáte správně, nebudete mít problém najít slabé místo vašeho systému.

Vezměme si jako příklad saturaci CPU fondu zdrojů. Vyhledat podrobnosti:

  • vyberte fond zdrojů a přejděte na výkon. Poté jej přepněte na Pokročilé a vyberte objekt CPU;
  • vyhodnoťte aktuální saturaci v MHz (použití);
  • Porovnejte hodnotu omezení fondu zdrojů a aktuální saturaci. Pokud se blíží limitu, existuje možnost, že vám chybí zdroje a vše, co musíte udělat, je přehodnotit hodnotu CPU připraveného samostatného VM v tomto velmi bazénu;

CPU Ready ověření:

  • pro CPU připraven. vyberte VM, přejděte na výkon, poté zvolte Rozšířený režim a přepněte na kontrolu ” CPU ” (pokud máte problémy s výkonem konkrétního VM, začněte s tímto);
  • vyhodnotit připraveno pro všechny “objekty”VM. “Objekt” je samostatný virtuální procesor VM. Chcete-li si to představit, budete muset změnit vlastnosti “Možnosti grafu…”;
  • řekněte mi, přesahuje minimální nebo průměrná hodnota připravenosti pro jakýkoli virtuální procesor 2000ms? Pokud ano, kdy, je nyní vše jasné. Jednoduše vám chybí zdroje procesoru kvůli limitu nastavenému na váš fond zdrojů;
  • nyní udělejte totéž pro zbytek VM v tomto fondu.

ověření sytosti procesoru hostitele:

  • Vyberte hostitele, přejděte na výkon, přepněte do pokročilého režimu a vyberte objekt “CPU”;
  • vyhodnoťte aktuální saturaci v MHz (použití);
  • přesahuje 75% nebo horní část je 90%? Pokud ano, pak vám možná chybí zdroje hostitelského procesoru. Ověřte CPU připravený pro VM na tomto hostiteli, jak jsem to udělal níže. Pokud průměrná saturace centrálního procesoru nepřesáhne 75%, další je pro vás podívat se!

CPU Ready ověření:

  • pokud se chystáte řešit výkon konkrétního VM, začněte s tímto. V opačném případě Vyberte hostitele, přesuňte se na virtuální stroje, vyřešte seznam jako v hostitelském CPU-MHz (sloupec ke sloupci) a podívejte se na jeden nebo dva virtuální počítače od začátku seznamu;
  • Chcete-li změřit CPU Ready, vyberte VM, přejděte na výkon, přepněte do pokročilého režimu a poté přepněte na kontrolu “CPU” (pokud máte v úmyslu vyřešit problémy s výkonem konkrétního VM, začněte s tímto);
  • vyhodnotit připraveno pro všechny “objekty”VM. “Objekt” je samostatný virtuální procesor VM. Budete muset změnit vlastnosti “Možnosti grafu…”, abyste si to mohli představit;
  • přesahuje minimální nebo průměrná hodnota připravenosti pro jakýkoli virtuální procesor 2000 MS? Pokud ano, chybí vám zdroje hostitelského procesoru.

potenciálně problematické parametry, které vyžadují ověření:

  • ověření nasycení procesoru;
  • ověření výměny aktivní paměti VM;
  • ověření čekání na výměnu VM;
  • ověření komprese paměti VM;
  • ověření přetíženého paměťového zařízení;
  • klesl příjem paketů ověření;
  • klesl přenos paketů ověření;
  • jeden vCPU v ověření SMP VM;
  • VM CPU připraven v hostiteli s průměrným ověřením zatížení;
  • pomalé nebo přetížené ověření úložného systému;
  • Horní ověření zatížení úložného systému;
  • špičkové ověření přenosu dat v síti;
  • nízké ověření nasycení procesoru VM;
  • ověření výměny paměti VM;
  • ověření poptávky po paměti s vysokým zdrojem;
  • ověření poptávky po vysoké hostitelské paměti;
  • ověření požadavku na vysokou paměť hosta;
  • ověření rychlosti přerušení s vysokým časovačem;
  • ověření nastavení NUMA;
  • ověření doby odezvy snímků s vysokým VM;

problémy s diskovým subsystémem

Stručně řečeno, můžete zúžit problémy s úložným systémem na:

1. Úložný systém je přetížen;

  • jaké jsou důvody, proč může být úložný systém přetížen? Primární jsou poměrně jednoduché, ať už by to byly špatné konfigurace (množství a typ zařízení/úroveň RAID/ukládání do mezipaměti/atd.)
    neexistuje žádné univerzální řešení, takže budu jen dát na můj kapitán zřejmý uniformu a seznam dolů věci, které pravděpodobně již víte:
  • Sestavte si svůj úložný systém s ohledem na výkon, a to nejen kapacity;
    vzít v úvahu, že když jdete virtuální, typ zatížení může přepínat příliš (z konzistentní náhodné);
    mají v obchodě nástroje pro sledování výkonu úložného systému disku, je třeba sledovat spolu s esxtop;
  • (Esxtop – nástroj VMware console, funguje dobře sledování výkonu úložiště. Přihlaste se do relace ssh a spusťte. Pro ty z vás, kteří mají tendenci používat resxtop: budete si muset stáhnout VMA nebo vSphere CLI pro Linux a odtud spustit tento nástroj. Ale abych byl spravedlivý, poslední verze je univerzální, protože pracuje s ESX i ESXi;
  • také existuje skvělý nástroj vSCSIStats;
    pokud vás zajímá, proč úložný systém pracuje tak pomalu, můžete to zjistit pomocí syntetického zatížení FIO;
    mějte na paměti, že některé aplikace mohou snížit režijní náklady na disku, pokud jim poskytnete více paměti.

2. Pomalý úložný systém;
V podstatě udělejte vše ze seznamu výše!

3. Zpoždění úložného systému;
3 jednoduchá řešení:

akcie;
Limit IOPS;
práh přetížení (řízení úložiště IO).

4. Špatné disky;
pravidelně kontrolujte diskové/ síťové úložiště a pokud by něco selhalo nebo zastaralo, okamžitě jej vyměňte. Měli byste však vědět, že v některých případech, zejména když disk selhal, může spuštění kontroly (další použití paměti RAID) přivést ostatní disky ke stejnému osudu = doom celý RAID.

5. ESXi OS;
použijte samostatné disky pro hostitelský OS ESXi, odkládací oddíl a VM umístěné na lokálních datových úložištích. Také přemýšlejte o použití RAID ke zlepšení výkonu čtení a zápisu.

6.
odstraňte všechny nepoužité nebo redundantní snímky, to není volitelné. Nyní musíte vědět, že čím více snímků máte, tím větší budou režijní náklady na disk s aktivitou I / O.

7. Šifrování;
šifrování disku používejte pouze v případě potřeby! Šifrování vede k režijním nákladům, režijní náklady vedou ke snížení výkonu,a to nechceme, že ne?

(pokud máte zájem o další informace, můžete si je vyhledat sami)

malé tipy

nasazení vRealize Operations Manager pro hlubší posouzení vašeho prostředí

tento vRealize Operations Manager je produkt VMware určený pro komplexní monitorování a správu virtuální infrastruktury VMware vSphere. Prodejce slíbil integrované pracovní řešení problémů. Můžete si jej stáhnout zde.

položte si otázku: chová se VM opravdu podivně?

VM, který je vystaven velkému pracovnímu zatížení, může někdy vypadat, že rozdává špatný výkon. Například virtualizované instance SQL serverů nebo špatně napsané SQL dotazy mohou zpomalit váš výkon velký čas! Poštovní servery s velkými uživatelskými základnami mohou být v tomto ohledu také trochu problémem. Naštěstí grafy monitorování výkonu v webovém klientovi vSphere vám pomohou měřit využití zdrojů ve stanoveném období, abyste mohli potvrdit, zda bylo znepokojující chování jednorázovou věcí nebo probíhalo, a určit, zda se za takových okolností očekává nebo ne. MS SQL a Exchange Server zabírají jakoukoli RAM z hostujícího operačního systému VM, který mohou najít, zejména pokud je nakonfigurováno dynamické přidělování paměti.

Analyze I/O Workloads to Determine Storage Performance Requirements

nejnovější aktualizace a nejnovější verze

aktualizace a nejnovější verze častěji řeší problémy s výkonem s opravenými chybami, vylepšenými ovladači a kódem. Nicméně, věř mi na tohle; někdy, nejnovější verze je ještě horší! Takže zůstaňte znepokojeni a vyzkoušejte, dokud si nejste jisti. Nebo alespoň nechte ostatní, aby se na tom pokusili pracovat, abyste mohli učinit rozhodnutí, které bylo promyšleno.

antivirový software ESXi

máte větší šanci narazit na jednorožce, ale ve skutečnosti existují případy, kdy najdete antivirový software běžící na ESXi (vShield). Není třeba dále vysvětlovat, že taková věc může vážně ovlivnit výkon VM několika způsoby, pokud není správně nakonfigurována. Musíte také pamatovat, že není důvod spouštět antivirový software na ESXi kvůli jeho malé ploše a vestavěným bezpečnostním funkcím. Navrhoval bych, že by bylo mnohem lepší, kdyby byl anti-malware software zařazen do hostujícího operačního systému VM. Pokud musíte nainstalovat AV na ESXi, udělejte to místo pro vyloučení souborů VM, jako jsou VMDKs, ze skenovacích plánů, zejména během špičkových hodin využití.

je povolena správa napájení CPU?

řízení výkonu CPU, pokud je povoleno na serverech ESXi, může vést k latenci rychlosti, která může být zase zachycena aplikacemi nebo pracovním zatížením, což má za následek pomalejší výkon. Pokud si myslíte, že se jedná o kořen problému, musíte jej zkontrolovat pomocí dokumentace dodavatele o zakázání správy napájení CPU. V případě, že to má nulový účinek, znovu jej povolte a několikrát proveďte kontrolu stavu (více informací zde)

Napájecí baterie pro řadiče Bios a SCSI

zkontrolujte napájecí baterii pro subsystém Bios vašeho hostitele ESXi, pokud to SPECIFIKACE umožňují, také pro SCSI nebo jiné regulátory. SCSI cache často vyžaduje další napájení pro práci a napájecí baterie na desce regulátoru ji obvykle poskytuje. Přestože SPECIFIKACE tvrdí, že se jedná o záložní plán napájení, zjistil jsem, že podpětí Napájecí baterie vede k chybám v práci regulátorů a podařilo se mi to opravit pouze výměnou.

několik rad na konci:

  • proveďte kontrolu stavu veškeré fyzické architektury pro váš úložný systém, včetně přepínačů iSCSI, síťových a optických kabelů atd.
  • zkontrolujte protokoly přepínačů a ujistěte se, že nedošlo k žádným chybám nebo jiným nešťastným událostem v úložném systému nebo samotném zařízení.
  • Ping iSCSI z vašich adres vmkernel, jen aby se ujistil, že připojení k iSCSI není žádný problém.
  • proveďte kontrolu stavu samotného SAN – ujistěte se, že neexistují žádné neúspěšné disky, události převzetí služeb při selhání řadiče úložiště nebo jiné chyby, které mohou ovlivnit výkon.
  • zkontrolujte volné místo na disku na každém LUN připojeném k hostitelům ESXi.

závěry

vím, řešení problémů VMware vSphere ESXi může vypadat trochu děsivě. S přesnou dokumentací, dobrým porozuměním vaší infrastruktuře a několika účinnými vestavěnými nástroji však můžete vyřešit všechny problémy, které trápí vaše VM. Stačí se na chvíli zastavit a přemýšlet, kde přesně a jaký problém máte, a pak zjistit, která část systému způsobuje potíže. Doufám, že nástroje, příkazový řádek ESXTOP, esxcli a v neposlední řadě vRealize Operations Manager vám pomohou, pokud to bude potřeba. Neváhejte také požádat o pomoc technickou podporu VMware nebo dodavatele. Velmi často vám mohou pomoci opravit to úžasně rychle.

Leave a Reply