sfaturi și trucuri pentru a depana performanța slabă vSphere

Introducere

ca orice alt administrator, știți că VMs în cele din urmă începe să sufere de întreruperi, probleme de performanță, sau pur și simplu nu mai răspunde. Acesta este un fapt de viață, din păcate. Șansele sunt, ca inginer de virtualizare, probabil că ați întâlnit deja aceste probleme cel puțin o dată. Și din moment ce mediul virtualizat este un sistem destul de complicat, pot exista prea multe motive sau factori diferiți care au impact asupra performanței VM slabe. Încercarea de a afla ce este greșit vă poate lua mult timp.

astăzi, vom încerca împreună să determinăm ce poate determina infrastructura VMware să ofere performanțe slabe și să găsim modalități de a o evita.

Deci, ce veți avea nevoie pentru rezolvarea corectă a problemelor?

în primul rând, înregistrări. Înregistrările sunt Sfântul Graal în rezolvarea problemelor de mediu vSphere. Știu, știu. Desigur, aveți încredere în memoria dvs. 100% și, desigur, vă veți aminti tot ce trebuie să știți, cum ar fi acreditările pentru a vă conecta sau orice alte informații necesare. Cu toate acestea, totuși, ultimul lucru pe care doriți să se întâmple atunci când serverul dvs. eșuează brusc sau gazdele dvs. ESXi sunt supraîncărcate este încercarea nervoasă de a vă aminti parolele doar pentru a intra într-o gazdă sau vSphere vCenter.

de asemenea, orice documentație existentă, cum ar fi schemele de cluster vSphere, poate fi de mare ajutor. Dacă nu știți cu adevărat cum este configurat întregul sistem, asta vă va încetini foarte mult. Firește, nici unei persoane din lume nu-i place să țină evidența, dar credeți că, atunci când apare nevoia, veți fi recunoscători pentru că aveți informații ușor accesibile. Acum, să aruncăm o privire la ce ar trebui să constea aceste informații:

gazde ESXi:

  • Nume gazdă / adrese IP
  • versiunea ESXi gazdă și nivel de patch-uri
  • parola de Root (păstrați-l în locație securizată)
  • adrese IP înregistrate pentru stocare și interfață
  • descriere hardware gazdă
  • configurare stocare (iSCSI, etc)
  • Adaptoare de rețea (furnizor, versiunea driver, etc)

comutatoare de stocare:

  • adrese IP utilizate
  • Versiune Firmware
  • acreditări (păstrați-l în locație securizată)
  • Setări Vlan

matrice de stocare:

  • adresa IP a portului de gestionare SAN
  • nivel Firmware
  • configurație LUN, nivel RAID, număr de unități, dimensiuni, firmware unitate
  • Conectări și parole la interfața de gestionare a matricei SAN
  • instrumente de gestionare San specifice furnizorului (utilitare specifice)

după cum probabil puteți aduna până acum, cu cât mai multă documentație, cu atât mai bine. Din păcate, mulți administratori tind să ignore această regulă. De asemenea, documentația dvs. nu va fi prea utilă dacă este depășită, deci trebuie să țină pasul cu modificările pe măsură ce merg.

cu ce să începem?

1. Studiați cu atenție cele mai bune practici de performanță de la VMware

acest material rămâne critic și vital timp de doi ani. La început, există o schemă de depanare. Problemele posibile sunt sortate în funcție de relevanța lor (instrumente VMware, CPU, etc) și variind lor (de la 100% efect asupra performanței la un minim). Dacă îl utilizați, vă poate ajuta foarte mult să vă îmbunătățiți infrastructura.

2. Instrumente VMware?

asigurați-vă că instrumentele VMware sunt instalate, actualizate și rulează pe fiecare dintre VM-urile dvs. Practic, Pachetul VMware Tools este o suită de drivere de dispozitive virtuale care afectează performanța mașinii virtuale (de obicei în bine, desigur).

Verificați instalarea VMware Tools.

  • Selectați o gazdă în vSphere Web Client;
  • treceți la fila mașini virtuale;
  • adăugați coloana “Stare instrumente VMware”;
  • Verificați starea. Dacă scrie OK, începeți să căutați o altă modalitate de a îmbunătăți performanța.
  • nu rulează/nu este actualizat – instalați VMware Tools.

dacă instrumentele VMware nu pornesc, va trebui să remediați sistemul de operare invitat, deoarece acolo ar putea fi problema. Este fie actualizarea kernel-ului Linux, fie cineva din anumite motive a avut instrumentele VMware în Windows dezactivate.

dacă versiunea curentă VMware Tools este depășită, trebuie să faceți o actualizare utilizând meniul contextual al clientului vSphere Web. De obicei, acest lucru devine un caz după instalarea celor mai recente actualizări pe gazdele ESX/ESXi. Când ați terminat cu ele, nu uitați să actualizați și instrumentele VMware. În general, cu vSphere Web Client, puteți verifica cu ușurință pe instrumentele VMware, după cum sugerează următoarea schemă: vSphere Web Client

afișarea stării vmtools pentru VMs.
puteți adăuga vmtools făcând clic pe butonul din dreapta al mouse-ului pe titlu și selectându-l în consecință.

starea Vmtools
cu toate acestea, puteți aplica și scenariul PowerCLI, care verifică prezența pachetului vmtools și starea sa actuală. Cea mai mare parte a proprietăților legate de vmtools se găsește sub <vm>.oaspete.extensiondata.

VMware PowerCLI pentru ESXi și vSphere

PowerCLI pentru VMware vSphere este un instrument incredibil de puternic, bazat pe Microsoft PowerShell/ PowerCLI vă permite să execute 98% din sarcinile manuale pentru gestionarea infrastructurii virtuale din linia de comandă. Ca instrument, PowerCLI permite centralizarea managementului operațional al serverului ESXi și vCenter în linia de comandă. Datorită acestui utilitar minunat, puteți crea scenarii, monitoriza starea VM-urilor, stocării, rețelelor, conturilor de utilizator și, cireșul de pe tort, automatizați o mare parte a proceselor de operare. Puteți instala PowerCLI pe mașini cu Microsoft Windows 7 / Windows Server 2008 R2 și versiuni ulterioare, dar ceea ce este mai interesant, există mai multe versiuni pentru diferite kituri Linux.

PowerCLI este format din mai mult de 1900 cmdleturi pentru gestionarea infrastructurii cloud și virtuale VMware (vSphere, vSAN, vRealize Operations Manager, vCloud Director, Site Recovery Manager, Horizon 7 și vCloud Air). Când executați cmdlet, vă adresați API-ului pe serverul ESXi host sau vCenter selectat. Vești bune: puteți descărca cel mai recent patch de VMware PowerCLI de pe site-ul oficial VMware (da, desigur, veți avea nevoie de un cont pentru asta).  VMware PowerCLI pentru a continua cu consola PowerCLI, trebuie doar să porniți comanda rapidă VMware vSphere PowerCLI ca administrator.  consola PowerCLI

probleme de bază

1. Lipsa de resurse pentru VM

știu, știu, desigur, având suficiente resurse pentru VM pentru a efectua eficient este un must-have. Cu toate acestea, veți fi șocați de câte VM-uri nu li se atribuie resurse suficiente în funcție de cerințele sistemului de operare invitat și de aplicațiile care rulează sub acesta. Adică, ar trebui să știți că, în ciuda nenumăratelor beneficii pe care virtualizarea le aduce la masă, există întotdeauna cheltuieli generale cu care să vă confruntați. Cum ar fi, ce va face VM dacă rămâne fără RAM? Desigur, mașina dvs. va începe să schimbe pe disc mult mai frecvent. Dacă stocarea subiacentă este plină, performanța va suferi o lovitură uriașă. De aceea, ori de câte ori aveți șansa de a face acest lucru, utilizați rezervări, bazine de resurse, DRS și orice Puteți pentru a vă asigura că cantitatea corectă de resurse este alocată unui VM pentru o eficiență operațională maximă.

2. Monitorizarea performanței

practic, monitorizarea performanței este o funcție încorporată în clienții vSphere. Acesta de aici este unul dintre acele instrumente necesare care vă vor ajuta să examinați problemele legate de performanță. Este atât de bun, deoarece vă permite să utilizați alarme ori de câte ori este posibil, deci sunteți întotdeauna cu un pas înaintea oricărei probleme de performanță. Vmware ESXi

rețineți, totuși, că în timp ce lucrați la gazda locală ESXi, puteți ajunge doar la fila Performanță. Dacă doriți mai multe detalii, utilizați VMware vSphere vCenter. VMware vSphere vCenterfoarte IMPORTANT. Performanța și performanța avansată sunt mai mult decât instrumente de diagnosticare eficiente și informative. Dacă îl folosiți corect, nu veți avea probleme în a găsi punctul moale al sistemului dvs.

să luăm ca exemplu saturația procesorului de resurse. Pentru a căuta detalii:

  • alegeți piscina de resurse și treceți la performanță. Apoi, comutați-l la avansat și selectați obiect CPU;
  • evaluați saturația curentă în MHz (utilizare);
  • comparați valoarea limitării pool-ului de resurse și saturația curentă. Dacă este aproape de limită, există posibilitatea să nu aveți resurse și tot ce trebuie să faceți este să reevaluați valoarea CPU ready a VM-urilor separate în acest pool;

verificarea CPU Ready:

  • pentru CPU gata. selectați un VM, treceți la Performanță, apoi alegeți modul avansat și treceți la revizuirea “CPU” (dacă sunteți la depanarea performanței vm-ului specific, începeți cu acesta);
  • evaluați gata pentru toate “obiectele”VM. “Obiect” este un procesor virtual separat al VM. Va trebui să modificați proprietățile “Opțiuni diagramă…” pentru a-l imagina;
  • Spune-mi, valoarea minimă sau medie gata pentru orice procesor virtual depășește 2000ms? Dacă da, când, totul este clar acum. Pur și simplu nu aveți resurse de procesor din cauza limitei setate la piscina dvs. de resurse;
  • acum doar face același lucru pentru restul de VMs în acest bazin.

verificarea saturației procesorului gazdă:

  • selectați gazda, treceți la Performanță, apoi treceți la modul avansat și alegeți un obiect “CPU”;
  • evaluați saturația curentă în MHz (utilizare);
  • depășește 75% sau partea de sus este de 90%? Dacă da, atunci, probabil, vă lipsesc resursele procesorului gazdă. Verificați CPU gata pentru VM pe această gazdă așa cum am făcut mai jos. Dacă o saturație medie a procesorului central nu depășește 75%, următorul este să vă uitați!

verificarea CPU gata:

  • dacă sunteți în măsură să depanați performanța VM-ului specific, începeți cu acesta. În caz contrar, selectați o gazdă, treceți la mașini virtuale, sortați lista ca în gazdă CPU — MHz (coloană în coloană) și aruncați o privire la unul sau două VM-uri de la începutul listei;
  • pentru a măsura CPU Ready, selectați un VM, treceți la performanță, treceți la modul avansat și apoi treceți la revizuirea “CPU” (dacă sunteți la depanarea performanței vm-ului specific, începeți cu acesta);
  • evaluați gata pentru toate “obiectele”VM. “Obiect” este un procesor virtual separat al VM. Va trebui să modificați proprietățile “Opțiuni diagramă…” pentru a-l imagina;
  • valoarea minimă sau medie gata pentru orice procesor virtual depășește 2000ms? Dacă da, vă lipsesc resursele procesorului gazdă.

parametri potențial problematici care necesită verificare:

  • verificarea saturației procesorului invitat;
  • verificare activă a schimbului de memorie vm;
  • verificare așteptare Swap vm;
  • verificare compresie memorie VM;
  • verificare dispozitiv de stocare supraîncărcat;
  • a scăzut primi pachete de verificare;
  • a scăzut transmite pachete de verificare;
  • un vCPU într-o verificare SMP VM;
  • VM CPU gata în gazdă cu verificarea medie de încărcare;
  • lent sau supraîncărcat de verificare a sistemului de stocare;
  • Top verificare de încărcare a sistemului de stocare;
  • verificarea transmisiei de date;
  • verificarea saturației procesorului vm scăzut;
  • verificarea schimbării memoriei vm anterioare;
  • verificarea cererii de memorie a bazinului de resurse ridicat;
  • verificarea cererii de memorie a gazdei ridicate;
  • verificarea cererii de memorie ridicată pentru oaspeți;
  • verificarea ratelor de întrerupere a temporizatorului ridicat;
  • verificarea setărilor NUMA;
  • verificarea timpului de răspuns al instantaneelor VM ridicate;

probleme ale subsistemului discului

pe scurt, puteți restrânge problemele sistemului de stocare până la:

1. Un sistem de stocare este supraîncărcat;

  • care sunt motivele pentru care un sistem de stocare poate fi supraîncărcat? Ei bine, cele primare sunt destul de simple, indiferent dacă ar fi configurații greșite (cantitate și tip de dispozitive/nivel RAID/cache/etc) sau încărcare foarte mare.
    nu există nici o soluție universală, așa că am de gând doar pentru a pune pe căpitanul meu uniformă evidentă și lista de jos lucruri pe care probabil știți deja:
  • construi sistemul de stocare în ceea ce privește performanța, nu numai capacitatea;
    ia în considerare faptul că, atunci când te duci virtual, tipul de sarcină poate comuta prea (de la consecvent la Aleatoriu);
    nu au în utilități magazin pentru a monitoriza performanța disc sistem de stocare, trebuie să – l urmăriți împreună cu esxtop;
  • (esxtop-instrumentul VMware console, funcționează bine pentru a monitoriza performanța de stocare. Conectați-vă la sesiunea ssh și începeți. Pentru aceia dintre voi care tind să utilizeze resxtop: va trebui să descărcați VMA sau vSphere CLI Pentru Linux și să porniți acest instrument de acolo. Dar pentru a fi corect, ultima versiune este universală pentru că funcționează atât cu ESX, cât și cu ESXi;
  • de asemenea, există un utilitar vscsistats genial;
    dacă vă întrebați de ce sistemul de stocare funcționează atât de lent, vă puteți da seama cu sarcina sintetică FIO;
    rețineți că anumite aplicații își pot reduce cheltuielile de disc dacă le oferiți mai multă memorie.

2. Sistem de stocare lent;
practic, face totul din lista de mai sus!

3. Întârzieri ale sistemului de stocare;
3 soluții simple:

acțiuni;
limita IOPS;
prag de congestie (control IO de stocare).

4. Discuri proaste;
verificați în mod regulat spațiul de stocare pe disc/ rețea și, dacă ceva ar eșua sau ar fi depășit, înlocuiți-l imediat. Cu toate acestea, ar trebui să știți că, în unele cazuri, mai ales atunci când discul a eșuat, începerea verificării (utilizarea suplimentară a memoriei RAID) poate aduce alte discuri la aceeași soartă = doom the whole RAID.

5. ESXi OS;
utilizați discuri separate pentru sistemul de operare gazdă ESXi, partiția swap și VM-urile care locuiesc pe un magazin de date local. De asemenea, gândiți-vă la utilizarea RAID pentru a îmbunătăți performanța de citire și scriere.

6. Instantanee;
ștergeți orice instantanee neutilizate sau redundante, nu este opțional. Trebuie să știți până acum că cu cât aveți mai multe instantanee, cu atât vor fi mai mari cheltuielile de disc cu activitatea I/O.

7. Criptare;
utilizați criptarea discului numai atunci când este necesar! Criptarea duce la cheltuieli generale, cheltuielile generale duc la scăderea performanței și nu vrem asta, nu-i așa?

(dacă sunteți interesat de mai multe informații, sunteți binevenit să-l caute singur)

sfaturi mici

implementarea vRealize Operations Manager pentru o evaluare mai profundă a mediului dumneavoastră

acest vRealize Operations Manager este un produs VMware desemnat pentru monitorizarea complexă și gestionarea infrastructurii virtuale VMware vSphere. Furnizorul a promis o depanare integrată de lucru. Îl puteți descărca aici.

puneți-vă o întrebare: VM se comportă într-adevăr ciudat?

un VM care a fost supus unui volum mare de muncă poate părea uneori că oferă performanțe slabe. De exemplu, instanțele virtualizate ale serverelor SQL sau interogările SQL slab scrise vă pot încetini performanța! Serverele de mail cu baze mari de utilizatori pot fi un pic de o problemă în această privință, de asemenea. Din fericire, diagramele de monitorizare a performanței din vSphere Web client vă vor ajuta să măsurați utilizarea resurselor într-o perioadă specificată, astfel încât să puteți confirma dacă comportamentul tulburător a fost un lucru unic sau în curs de desfășurare și să determinați dacă este de așteptat sau nu în astfel de circumstanțe. MS SQL și Exchange Server preiau orice memorie RAM din sistemul de operare invitat al VM pe care îl pot găsi, mai ales dacă este configurată alocarea dinamică a memoriei.

Analyze I/O Workloads to Determine Storage Performance Requirements

cele mai recente actualizări și cele mai recente versiuni

actualizări și cele mai recente versiuni de cele mai multe ori nu aborda probleme de performanță cu bug-uri fixe, drivere îmbunătățite, și Codul. Cu toate acestea, crede-mă pe asta; uneori, cea mai recentă versiune face chiar mai rău! Așa că rămâneți alarmat și testați până când sunteți sigur. Sau cel puțin lăsați-i pe alții să încerce să lucreze la ea, astfel încât să puteți lua o decizie care a fost gândită.

software Antivirus ESXi

aveți o șansă mai mare de a vă lovi de un unicorn, dar există cazuri, de fapt, când puteți găsi software antivirus care rulează pe ESXi (vShield). Nu este nevoie să explicați în continuare că un astfel de lucru poate afecta grav performanța VM în mai multe moduri dacă nu este configurat corect. De asemenea, trebuie să vă amintiți că nu există niciun motiv pentru a rula software antivirus pe ESXi datorită amprentei sale mici și a caracteristicilor de securitate încorporate. Aș sugera că ar fi mult mai bine dacă software-ul Anti-malware să fie retrogradat în sistemul de operare invitat al VM. Dacă trebuie să instalați AV pe ESXi, face un punct pentru a exclude fișierele VM, cum ar fi VMDKs din programele de scanare, în special în timpul orelor de utilizare de vârf.

este activată gestionarea puterii procesorului?

gestionarea puterii procesorului, dacă este activată pe serverele ESXi, poate duce la latența vitezei, care, la rândul său, poate fi preluată de aplicații sau sarcini de lucru, rezultând o performanță mai lentă. Dacă credeți că aceasta este rădăcina problemei, trebuie să o verificați cu documentația furnizorului privind dezactivarea gestionării energiei procesorului. În cazul în care are efect zero, reactivați-l și efectuați o verificare de sănătate de câteva ori (mai multe detalii aici)

baterie de alimentare pentru controlerele Bios și SCSI

verificați o baterie de alimentare pentru subsistemul Bios al gazdei dvs. Cache-ul SCSI necesită adesea o putere suplimentară pentru lucru, iar bateria de alimentare de pe placa controlerului o furnizează de obicei. Chiar dacă specificațiile susțin că este un plan de alimentare de rezervă, am aflat că subtensiunea bateriei de alimentare duce la greșeli în activitatea controlerelor și am reușit să o remediez doar prin înlocuire.

câteva sfaturi în cele din urmă:

  • efectuați o verificare a stării de sănătate a întregii arhitecturi fizice pentru sistemul dvs. de stocare, inclusiv comutatoarele iSCSI, cablurile de rețea și optice etc.
  • verificați jurnalele comutatoarelor pentru a vă asigura că nu există erori sau alte evenimente nefericite care se întâmplă cu sistemul de stocare sau dispozitivul în sine.
  • Ping iSCSI de la adresele vmkernel, doar pentru a vă asigura că conectarea la iSCSI nu este o problemă.
  • efectuați o verificare de sănătate pentru SAN în sine – asigurați-vă că nu există discuri eșuate, evenimente de eroare ale controlerului de stocare sau orice alte greșeli care pot afecta performanța.
  • verificați spațiu liber pe disc pe fiecare LUN conectat la gazdele ESXi.

concluzii

știu, depanare VMware vSphere ESXi poate arata un pic infricosator. Cu toate acestea, cu o documentație precisă, o bună înțelegere a infrastructurii dvs. și câteva instrumente eficiente încorporate, puteți remedia orice probleme care vă tulbură VM-urile. Opriți-vă pentru o clipă și gândiți-vă exact unde și ce problemă aveți și apoi dați seama ce parte a sistemului cauzează probleme. Sper că utilitățile, linia de comandă ESXTOP, esxcli și, nu în ultimul rând, vRealize Operations Manager vă vor putea ajuta dacă va fi nevoie vreodată. De asemenea, nu ezitați să solicitați asistență tehnică VMware sau furnizor pentru ajutor. Foarte des, vă pot ajuta să o remediați uimitor de repede.

Leave a Reply