Tips og Tricks til fejlfinding af dårlig vSphere-ydeevne

introduktion

som enhver anden administrator ved du, at VM ‘ erne i sidste ende begynder at lide af forstyrrelser, ydelsesproblemer eller blot stoppe med at svare. Det er desværre en kendsgerning i livet. Chancerne er, at du som virtualiseringsingeniør sandsynligvis allerede har mødt disse problemer mindst en gang. Og da det virtualiserede miljø er et ret kompliceret system, kan der være for mange forskellige grunde eller faktorer, der påvirker dårlig VM-ydeevne. At prøve at finde ud af, hvad der er galt, kan tage meget af din tid.

i dag forsøger vi sammen at finde ud af, hvad der kan få din infrastruktur til at give væk dårlig ydeevne og finde måder at undgå det på.

så hvad skal du bruge til korrekt fejlfinding?

først og fremmest optegnelser. Optegnelser er den hellige gral til løsning af vSphere-miljøproblemer. Jeg ved det, jeg ved det. Selvfølgelig stoler du på din hukommelse 100%, og selvfølgelig vil du huske alt hvad du behøver at vide, som legitimationsoplysninger til at logge ind eller andre nødvendige oplysninger. Men det sidste, du vil ske, når din server pludselig fejler, eller dine værter bliver overbelastet, forsøger nervøst at huske adgangskoder bare for at komme ind i en vært eller vSphere vCenter.

enhver eksisterende dokumentation, såsom vSphere-klyngeskemaer, kan også være til stor hjælp. Hvis du ikke rigtig ved, hvordan hele systemet er konfigureret, det vil bremse dig ned big time. Naturligvis elsker ingen mennesker i verden faktisk at føre optegnelser, men tro, når behovet opstår, vil du være taknemmelig for at have let tilgængelig information. Lad os nu se på, hvad denne info skal bestå af:

:

  • hostnavne / IP-adresser
  • host version og patch level
  • rodadgangskode (opbevar den i sikret placering)
  • optagede IP-adresser til opbevaring og interface
  • host udstyr beskrivelse
  • Lagringskonfiguration (iSCSI osv.)
  • netværkskort (leverandør, driverversion osv)

opbevaring skifter:

  • IP-adresser brugt
  • Fastvareversion
  • legitimationsoplysninger (opbevar det i sikret placering)
  • VLAN-indstillinger

Storage Array:

  • IP-adresse på San management port
  • Firmavejsniveau
  • lun-konfiguration, RAID-niveau, antal drev, størrelser, drevvare
  • Logins og adgangskoder til San array management interface
  • leverandørspecifikke San-styringsværktøjer (specifikke hjælpeprogrammer)

som du sandsynligvis kan samle nu, jo mere dokumentation, jo bedre. Desværre har mange administratorer en tendens til at ignorere denne regel. Din dokumentation vil heller ikke være meget nyttig, hvis den er forældet, så den skal følge med ændringerne, når de går.

hvad skal man begynde med?

1. Undersøg omhyggeligt de bedste præstationspraksis fra VM

dette materiale forbliver kritisk og afgørende i to år nu. I begyndelsen er der en fejlfindingsplan. De mulige problemer sorteres ud efter deres relevans (FVM-værktøjer, CPU osv.) og deres rækkevidde (fra 100% effekt på ydeevne til en minimal). Hvis du bruger det, kan det hjælpe dig meget med at forbedre din infrastruktur.

2. Værktøj?

sørg for, at dine VM-værktøjer er installeret, opgraderet og kører på hver eneste af dine VM ‘ er. Grundlæggende er en pakke med virtuelle enhedsdrivere, der påvirker ydelsen på den virtuelle maskine (normalt til det bedre, selvfølgelig).

kontroller installation af værktøjsværktøjer.

  • vælg en vært i vSphere-klient;
  • Flyt til fanen virtuelle maskiner;
  • Tilføj kolonnen “Status for værktøjsværktøjer”;
  • Kontroller status. Hvis det siger OK, skal du begynde at lede efter en næste måde at forbedre ydeevnen på.
  • ikke kører / forældet-installer VM-værktøjer.

hvis værktøjet ikke starter, skal du rette gæstens operativsystem, fordi det er her problemet kan være. Det er enten en opdatering af kernen, eller nogen har af en eller anden grund haft deaktiverede værktøjer.

hvis din nuværende version er forældet, skal du gå til en opgradering ved hjælp af vSphere-klientens kontekstmenu. Normalt bliver det en sag efter installation af de seneste opdateringer på værter. Når du er færdig med dem, skal du ikke glemme at holde værktøjsværktøjerne opdaterede. Samlet set kan du med vSphere-klient nemt tjekke op på dine VM-værktøjer, som følgende skema antyder: vSphere-klient

vmtools Statusvisning for VM ‘ er.
du kan tilføje vmtools ved at klikke på højre museknap på titlen og vælge den i overensstemmelse hermed.

vmtools status
du kan dog også anvende Strømcli-scenariet, som kontrollerer tilstedeværelsen af vmtools-pakken og dens aktuelle tilstand. Størstedelen af de ejendomme, der er relateret til vmtools, findes under <vm>.gæst.udvidelsesdata.

giver dig mulighed for at udføre 98% af manuelle opgaver til styring af virtuel infrastruktur fra kommandolinjen. Som et værktøj tillader vi centralisering af operativ styring af vCenter Server og vCenter Server i kommandolinjen. Takket være dette vidunderlige værktøj er du i stand til at oprette scenarier, overvåge tilstanden af VM ‘ er, opbevaring, netværk, brugerkonti og kirsebær på kagen automatisere en stor del af driftsprocesserne. Du kan installere Maccli på maskiner med Microsoft vinduer 7 / vinduer Server 2008 R2 og højere, men hvad er mere interessant, der er flere versioner til forskellige Linuks-sæt.

består af mere end 1900 cmdlet ‘ er til styring af cloud-og virtuel VM-infrastruktur (vSphere, vSAN, Vrealisere Operations Manager, vCloud Director, Site Recovery Manager, horisont 7 og vCloud Air). Når du udfører cmdlet, adresserer du API ‘ en på den valgte host-eller vCenter-Server. Gode nyheder: du kan hente den seneste patch af fra officielle hjemmeside (yep, selvfølgelig, du skal bruge en konto til at). for at komme videre med konsollen, skal du bare starte genvejen som administrator. strømforsyning

grundlæggende problemer

1. Mangel på ressourcer til VM

jeg ved, jeg ved ganske vist, at have nok ressourcer til, at VM kan udføre effektivt, er et must-have. Du vil dog blive chokeret over, hvor mange VM ‘ er der ikke tildeles tilstrækkelige ressourcer i henhold til gæstens OS-krav og de applikationer, der kører under det. Jeg mener, du burde vide det som bagsiden af din hånd, at på trods af utallige fordele virtualisering bringer til bordet, er der altid omkostninger at kæmpe med. Ligesom, hvad vil VM gøre, hvis det løber tør for RAM? Naturligvis begynder din maskine at bytte til disk meget oftere. Hvis den underliggende opbevaring er fuld, vil ydeevnen lide et stort slag. Derfor, når du har en chance for at gøre det, skal du bruge reservationer, ressourcepuljer, DRS og alt hvad du kan for at sikre, at den korrekte mængde ressourcer tildeles en VM for maksimal driftseffektivitet.

2. Performance Monitoring

grundlæggende er performance monitoring en funktion indlejret i vSphere-klienter. Denne her er et af de nødvendige værktøjer, der hjælper dig med at undersøge præstationsrelaterede problemer. Det er så godt, fordi det giver dig mulighed for at bruge alarmer, hvor det er muligt, så du altid er et skridt foran ethvert ydelsesproblem.  <url>

Husk dog, at mens du arbejder på den lokale vært, kan du kun nå fanen Ydeevne. Hvis du vil have flere detaljer, skal du bruge vSphere vCenter. vSphere vCenter SUPER vigtigt. Ydeevne og avanceret ydeevne er mere end effektive og informative diagnostiske værktøjer. Hvis du bruger det rigtigt, har du ingen problemer med at finde det bløde sted i dit system.

lad os tage ressource Pool CPU mætning som et eksempel. At slå op detaljer:

  • Vælg ressource pool og flytte til ydeevne. Skift det derefter til avanceret, og vælg CPU-objekt;
  • Evaluer den aktuelle mætning i brug;
  • Sammenlign værdien af ressourcepuljebegrænsning og den aktuelle mætning. Hvis det er tæt på grænsen, er der en mulighed for, at du mangler ressourcer, og alt hvad du skal gøre er at revurdere CPU ready-værdien af de separate VM ‘ er i denne meget pool;

CPU klar verifikation:

  • til CPU klar. vælg en VM, gå til ydeevne, vælg derefter Avanceret tilstand, og skift til gennemgang af “CPU” (hvis du er klar til fejlfinding af den specifikke VM, start med den);
  • Evaluer klar til alle VM “objekter”. “Object” er en separat virtuel processor af VM. Du bliver nødt til at ændre egenskaberne for “Chart Options…” for at se det;
  • Fortæl mig, overstiger minimal eller gennemsnitlig klar værdi for enhver virtuel processor 2000ms? Hvis ja, hvornår er det helt klart nu. Du mangler simpelthen processorressourcer på grund af den grænse, der er indstillet til din ressourcepulje;
  • nu bare gøre det samme for resten af VM ‘ erne i denne pulje.

vært CPU mætning verifikation:

  • vælg værten, Flyt til ydeevne, skift derefter til avanceret tilstand, og vælg et “CPU” – objekt;
  • Evaluer den aktuelle mætning i MHS (brug);
  • overstiger det 75%, eller toppen er 90%? I så fald mangler du måske værtsprocessorressourcer. Bekræft CPU klar til VM på denne vært, som jeg gjorde nedenfor. Hvis en gennemsnitlig mætning af den centrale processor ikke overstiger 75%, er det næste for dig at se på!

CPU klar verifikation:

  • hvis du er i stand til at fejlfinde ydeevnen for den specifikke VM, skal du starte med den. Ellers skal du vælge en vært, flytte til virtuelle maskiner, sortere listen som I host CPU (kolonne til kolonne) og se på en eller to VM ‘ er fra begyndelsen af listen;
  • for at måle CPU Ready skal du vælge en VM, flytte til ydeevne, skifte til avanceret tilstand og derefter skifte til at gennemgå “CPU” (hvis du er op til fejlfinding af ydeevnen for den specifikke VM, start med den ene);
  • Evaluer klar til alle VM “objekter”. “Object” er en separat virtuel processor af VM. Du bliver nødt til at ændre egenskaberne for “Chart Options…” for at se det;
  • overstiger minimal eller gennemsnitlig klar værdi for enhver virtuel processor 2000ms? I så fald mangler du værtsprocessorressourcer.

potentielt problematiske parametre, der skal verificeres:

  • gæst CPU mætning verifikation;
  • Aktiv VM hukommelse bytte verifikation;
  • VM bytte vent verifikation;
  • VM hukommelse kompression verifikation;
  • overbelastet lagerenhed verifikation;
  • faldt modtage pakker verifikation;
  • faldt sende pakker verifikation;
  • en vCPU i en SMP VM verifikation;
  • VM CPU klar i værten med gennemsnitlig belastning verifikation;
  • langsom eller overbelastet lagringssystem verifikation;
  • Top Storage System load verifikation;
  • Peak verifikation af netværksdatatransmission;
  • verifikation af lav VM-Processormætning;
  • tidligere VM-Hukommelsesbytterbekræftelse;
  • verifikation af høj Ressourcepuljehukommelse;
  • verifikation af høj værtshukommelsesbehov;
  • verifikation af høj Gæstehukommelse;
  • verifikation af høj Timer-Afbrydelseshastigheder;
  • verifikation af NUMA-indstillinger;
  • bekræftelse af høj VM-snapshots responstid;

Disk delsystem problemer

kort sagt, Du kan indsnævre storage system problemer ned til:

1. Et lagersystem er overbelastet;

  • hvad er grundene til, at et lagersystem kan blive overbelastet? Nå, de primære er ret enkle, om det ville være forkerte konfigurationer (mængde og type enheder/RAID-niveau/caching/etc) eller meget høj belastning.
    der er ingen universel løsning, så jeg vil bare sætte på min kaptajn indlysende uniform og liste ned ting, du sikkert allerede ved:
  • Byg dit lagersystem med hensyn til ydeevne, ikke kun kapacitet;
    Tag højde for, at når du går virtuel, kan belastningstypen også skifte (fra konsekvent til tilfældig);
    har i butikken hjælpeprogrammer til at overvåge lagringssystemets diskydelse, skal du se det sammen med esstop;
  • (værktøj, fungerer godt til at overvåge opbevaring ydeevne. Log ind på SSH-sessionen og start. For dem af jer, der har tendens til at bruge : du bliver nødt til at hente vMA eller vSphere CLI for , og starte dette værktøj derfra.
  • der er også et strålende vscsistats-værktøj;
    hvis du undrer dig over, hvorfor lagersystemet fungerer så langsomt, kan du finde ud af det med FIO syntetisk belastning;
    Husk, at visse applikationer kan sænke deres diskomkostninger, hvis du giver dem mere hukommelse.

2. Langsom lagersystem;
dybest set, gøre alt fra listen ovenfor!

3. Forsinkelser i lagersystemet;
3 enkle løsninger:

aktier;
Begræns IOPS;
Overbelastningstærskel (opbevaring io-kontrol).

4. Dårlige diske;
kontroller din disk / netværkslagring regelmæssigt, og hvis noget skulle mislykkes eller gå forældet, skal du straks udskifte det. Du bør dog vide, at i nogle tilfælde, især når disken er mislykket, kan startkontrol (yderligere brug af RAID-hukommelse) bringe andre diske til samme skæbne = doom hele RAID.

5. Os;
Brug separate diske til værtsoperativsystemet, byttepartitionen og VM ‘ er, der findes på et lokalt datalager. Tænk også på at bruge RAID til at forbedre læse-og skriveydelsen.

6. Snapshots;
Slet ubrugte eller overflødige snapshots, det er ikke valgfrit. Du skal vide nu, at jo flere snapshots du har, jo større vil diskomkostningerne være med I/O-aktiviteten.

7. Kryptering;
Brug kun diskkryptering, når det er nødvendigt! Kryptering fører til generalomkostninger, generalomkostninger fører til nedsat ydeevne, og det ønsker vi ikke, gør vi nu?

(hvis du er interesseret i mere information, er du velkommen til at slå det op selv)

små tip

implementering af Vrealise Operations Manager for en mere dybtgående vurdering af dit miljø

denne Vrealise Operations Manager er et VM-produkt, der er udpeget til kompleks overvågning og styring af virtuel infrastruktur. Leverandør har lovet en integreret fungerende fejlfinding. Du kan hente det her.

Stil dig selv et spørgsmål:opfører VM virkelig mærkeligt?

en VM, der udsættes for en tung arbejdsbyrde, kan nogle gange se ud som om det giver væk dårlig præstation. For eksempel kan virtualiserede forekomster af servere eller dårligt skrevne forespørgsler bremse din præstation big time! Mailserverne med store brugerbaser kan også være lidt af et problem i denne henseende. Heldigvis, præstationsovervågningskortene i vSphere-klienten hjælper dig med at måle ressourceudnyttelse inden for en bestemt periode, så du kan bekræfte, om den bekymrende adfærd var en engangs ting eller igangværende, og for at afgøre, om det forventes eller ej under sådanne omstændigheder. RAM fra VM ‘ s gæst OS, de kan finde, især hvis dynamisk hukommelsesallokering er konfigureret.

Analyze I/O Workloads to Determine Storage Performance Requirements

seneste opdateringer og nyeste versioner

opdateringer og seneste udgivelser adresserer oftere end ikke ydelsesproblemer med faste fejl, forbedrede drivere og kode. Ikke desto mindre, tro mig på denne ene; nogle gange, den seneste udgivelse gør det endnu værre! Så bliv alarmeret og test, indtil du er sikker. Eller i det mindste lade andre forsøge at arbejde på det, så du kan træffe en beslutning, der blev gennemtænkt.

antivirusprogram esci

du har en større chance for at støde på en enhjørning, men der er faktisk tilfælde, hvor du kan finde antivirusprogrammer, der kører på esci (vShield). Ingen grund til at forklare yderligere, at en sådan ting alvorligt kan påvirke VM-ydeevnen på flere måder, hvis den ikke er konfigureret korrekt. Du skal også huske, at der ikke er nogen grund til at køre antivirusprogrammer på på grund af dets lille fodaftryk og indbyggede sikkerhedsfunktioner. Jeg vil foreslå, at det ville være meget bedre, hvis anti-ondsindede programmer blev henvist til VM ‘ s gæst OS. Hvis du skal installere AV, skal du gøre det til et punkt at udelukke VM-filer som VMDKs fra scanningsplaner, især i spidsbelastningstider.

er CPU-strømstyring aktiveret?

CPU-strømstyring, hvis den er aktiveret på servere, kan føre til hastighedsforsinkelse, som igen kan afhentes af applikationer eller arbejdsbelastninger, hvilket resulterer i langsommere ydelse. Hvis du mener, at dette er roden til problemet, skal du tjekke det op med leverandørdokumentationen om deaktivering af CPU-strømstyring. Hvis det har nul effekt, skal du genaktivere det og foretage et sundhedstjek et par gange (flere detaljer her)

strømbatteri til Bios-og SCSI-controllere

Kontroller et strømbatteri til Bios-undersystem af din Essi-vært, hvis specifikationerne tillader det, også for SCSI eller de andre controllere. SCSI cache kræver ofte ekstra strøm til arbejde, og strømbatteriet på controllerkortet giver det normalt. Selvom specifikationerne hævder, at det er en backup-strømplan, har jeg fundet ud af, at strømbatteriets underspænding fører til fejl i controllernes arbejde, og det lykkedes mig kun at ordne det ved udskiftning.

få råd til sidst:

  • Foretag en sundhedskontrol af al fysisk arkitektur til dit lagersystem, inklusive iSCSI-kontakter, netværk og optiske kabler, etc.
  • kontroller logfilerne for at sikre, at der ikke er fejl eller andre uheldige hændelser, der sker med lagringssystemet eller selve enheden.
  • Ping din iSCSI fra dine VMkernel-adresser, bare for at sikre, at det ikke er noget problem at oprette forbindelse til iSCSI.
  • Foretag en sundhedstjek for SAN selv – sørg for, at der ikke er fejlede diske, lagringscontroller failover-begivenheder eller andre fejl, der kan påvirke ydeevnen.
  • kontroller ledig diskplads på hver LUN, der er tilsluttet dine værter.

konklusioner

jeg ved, at fejlfinding kan se lidt skræmmende ud. Men med præcis dokumentation, en god forståelse af din infrastruktur og et par effektive indbyggede værktøjer kan du løse eventuelle problemer, der forstyrrer dine VM ‘ er. Bare stop et øjeblik og tænk hvor præcist og hvilket problem har du, og find ud af, hvilken del af systemet der forårsager problemer. Jeg håber, at utilities, command-line ESKTOP, eskcli, og sidst men ikke mindst vrealisere Operations Manager ville være i stand til at hjælpe dig, hvis behovet nogensinde opstår. Du skal heller ikke være tøvende med at bede om hjælp. Meget ofte kan de hjælpe dig med at løse det utroligt hurtigt.


Leave a Reply