Tips och Tricks för att felsöka Dålig vSphere-prestanda

introduktion

som alla andra administratörer vet du att VM: erna så småningom börjar drabbas av störningar, prestandaproblem eller helt enkelt sluta svara. Det är ett faktum i livet, tyvärr. Chansen är att du som virtualiseringsingenjör förmodligen redan har träffat dessa problem minst en gång. Och eftersom den virtualiserade miljön är ett ganska komplicerat system kan det finnas för många olika orsaker eller faktorer som påverkar dålig VM-prestanda. Att försöka ta reda på vad som är fel kan ta mycket tid.

idag försöker vi tillsammans bestämma vad som kan få din VMware-Infrastruktur att ge bort dålig prestanda och hitta sätt att undvika det.

så, vad du behöver för korrekt felsökning?

först av allt, poster. Records är den Heliga Graal i att lösa vSphere miljöproblem. Jag vet, jag vet. Naturligtvis litar du på ditt minne 100%, och naturligtvis kommer du ihåg allt du behöver veta, som referenser för att logga in eller annan nödvändig information. Men det sista du vill hända när din server plötsligt misslyckas eller dina ESXi-värdar överbelastas är nervöst att försöka komma ihåg lösenord bara för att ange en värd eller vSphere vCenter.

dessutom kan all befintlig dokumentation, såsom vSphere cluster-system, vara till stor hjälp. Om du inte riktigt vet hur hela systemet är konfigurerat, kommer det att sakta ner dig stor tid. Naturligtvis älskar ingen person i världen faktiskt att hålla register, men tro, när behovet uppstår, kommer du att vara tacksam för att ha lättillgänglig information. Låt oss nu ta en titt på vad denna information ska bestå av:

ESXi hosts:

  • värdnamn / IP-adresser
  • ESXi-värdversion och patchnivå
  • Root-lösenord (håll det på säker plats)
  • inspelade IP-adresser för lagring och gränssnitt
  • Värdmaskinvarubeskrivning
  • lagringskonfiguration (iSCSI, etc)
  • nätverksadaptrar( leverantör, drivrutinsversion, etc)

Lagringsbrytare:

  • IP-adresser som används
  • firmwareversion
  • referenser (håll den på säker plats)
  • VLAN-inställningar

lagringsmatris:

  • IP-adress för San management port
  • Firmware nivå
  • Lun konfiguration, RAID-nivå, antal enheter, storlekar, enhet firmware
  • inloggningar och lösenord till SAN array management interface
  • leverantörsspecifika SAN management tools (specifika verktyg)

som du förmodligen kan samla nu, ju mer dokumentation, desto bättre. Tyvärr tenderar många administratörer att ignorera denna regel. Din dokumentation kommer inte heller att vara mycket användbar om den är föråldrad, så den måste hålla jämna steg med ändringarna när de går.

Vad ska man börja med?

1. Studera noggrant de bästa prestandapraxis från VMware

detta material förblir kritiskt och viktigt i två år nu. I början finns det ett Felsökningsschema. De möjliga problemen sorteras ut efter deras relevans (VMware Tools, CPU, etc) och deras varierande (från 100% effekt på prestanda till en minimal). Om du använder det kan det hjälpa dig mycket att förbättra din Infrastruktur.

2. VMware Verktyg?

se till att VMware-verktyg installeras, uppgraderas och körs på var och en av dina virtuella datorer. I grund och botten är VMware Tools-paketet en serie virtuella enhetsdrivrutiner som påverkar den virtuella maskinens prestanda (vanligtvis till det bättre, förstås).

Verifiera installationen av VMware Tools.

  • välj en värd i vSphere Web Client;
  • flytta till fliken virtuella maskiner;
  • Lägg till kolumnen “VMware Tools Status”;
  • kontrollera statusen. Om det står OK, börja leta efter ett nästa sätt att förbättra prestanda.
  • inte igång / inaktuell – installera VMware Tools.

om VMware-verktyg inte startar måste du fixa gäst OS, för det är där problemet kan vara. Det är antingen Linuxkärnan uppdatering eller någon av någon anledning har haft VMware verktyg i Windows inaktiverad.

om din nuvarande VMware Tools-version är föråldrad måste du gå till en uppgradering med hjälp av vSphere Web Client-snabbmenyn. Vanligtvis blir det ett fall efter att ha installerat de senaste uppdateringarna på ESX / ESXi-värdar. När du är klar med dem, glöm inte att hålla VMware Tools uppdaterade också. Sammantaget kan du med vSphere Web Client enkelt kontrollera dina VMware-verktyg, vilket följande schema antyder: vSphere Web Client

vmtools statusvisning för VM.
du kan lägga till vmtools genom att klicka på höger musknapp på titeln och välja den därefter.

vmtools status
du kan dock också tillämpa PowerCLI-scenariot, som kontrollerar närvaron av vmtools-paketet och dess nuvarande tillstånd. Huvuddelen av egenskaperna relaterade till vmtools finns under <vm>.gäst.extensiondata.

VMWare PowerCLI för ESXi och vSphere

PowerCLI för VMware vSphere är ett otroligt kraftfullt verktyg, baserat på Microsoft PowerShell/ PowerCLI kan du utföra 98% av manuella uppgifter för att hantera virtuell infrastruktur från kommandoraden. Som ett verktyg tillåter PowerCLI att centralisera operativ hantering av ESXi och vCenter Server i kommandoraden. Tack vare detta underbara verktyg kan du skapa scenarier, övervaka tillståndet för VM, lagring, nätverk, användarkonton och, körsbäret på kakan, automatisera en stor del av driftsprocesserna. Du kan installera PowerCLI på maskiner med Microsoft Windows 7 / Windows Server 2008 R2 och högre, men vad är mer intressant, det finns flera versioner för olika Linux-Kit.

PowerCLI består av mer än 1900 cmdlets för hantering av moln och virtuell VMware-Infrastruktur (vSphere, vSAN, vRealize Operations Manager, vCloud Director, Site Recovery Manager, Horizon 7 och vCloud Air). När du kör cmdlet adresserar du API på vald ESXi-värd eller vCenter-Server. Goda nyheter: Du kan ladda ner den senaste korrigeringen av VMware PowerCLI från VMwares officiella webbplats (Japp, naturligtvis behöver du ett konto för det).  VMware PowerCLI för att fortsätta med PowerCLI-konsolen, starta bara VMware VSphere PowerCLI-genväg som administratör. PowerCLI konsol

grundläggande problem

1. Brist på resurser för VM

jag vet, jag vet, visserligen, att ha tillräckligt med resurser för VM att utföra effektivt är ett måste. Du skulle dock bli chockad över hur många virtuella datorer som inte tilldelas tillräckliga resurser enligt Gästens OS-krav och de applikationer som körs under den. Jag menar, du borde veta det som baksidan av din hand att trots otaliga fördelar virtualisering ger till bordet, det finns alltid omkostnader att brottas med. Gilla, vad ska VM göra om det tar slut på RAM? Naturligtvis börjar din maskin byta till disk mycket oftare. Om den underliggande lagringen är full kommer Prestanda att drabbas av ett stort slag. Det är därför, när du har en chans att göra det, använd reservationer, resurspooler, DRS och allt du kan för att se till att rätt mängd resurser tilldelas en VM för maximal operativ effektivitet.

2. Prestandaövervakning

i grund och botten är prestandaövervakning en funktion inbäddad i vSphere-klienter. Den här här är ett av de nödvändiga verktygen som hjälper dig att undersöka prestationsrelaterade problem. Det är så bra eftersom det gör att du kan använda larm där det är möjligt, så du är alltid ett steg före alla prestandaproblem. Vmware ESXi

tänk dock på att när du arbetar på den lokala ESXi-värden kan du bara nå fliken Prestanda. Om du vill ha mer information, använd VMware bisexual vSphere vCenter. VMware bisexual vSphere vCenter SUPER viktigt. Prestanda och avancerad prestanda är mer än effektiva och informativa diagnostiska verktyg. Om du använder det rätt, har du inga problem att hitta den mjuka platsen i ditt system.

Låt oss ta resurspool CPU mättnad som ett exempel. Att slå upp detaljer:

  • Välj resurspool och gå till prestanda. Växla sedan upp det till Avancerat och välj CPU-objekt;
  • utvärdera aktuell mättnad i MHz (användning);
  • jämför värdet på resurspoolbegränsningen och den aktuella mättnaden. Om det är nära gränsen finns det en möjlighet att du saknar resurser och allt du behöver göra är att omvärdera CPU-redovärdet för de separata VM: erna i den här poolen;

CPU klar verifiering:

  • för CPU redo. välj en VM, flytta till prestanda, välj sedan Avancerat läge och byt till att granska “CPU” (om du är upp till felsökning av prestanda för den specifika VM, börja med den);
  • utvärdera redo för alla VM “objekt”. “Object” är en separat virtuell processor av VM. Du måste ändra egenskaperna för “Chart Options…” för att bilda det;
  • berätta för mig, överstiger minimalt eller genomsnittligt Redovärde för någon virtuell processor 2000ms? Om så är fallet, när är det allt klart nu. Du saknar helt enkelt processorresurser på grund av gränsen för din resurspool;
  • gör nu bara detsamma för resten av VM: erna i denna pool.

värd CPU mättnad verifiering:

  • Välj värden, flytta till prestanda, byt sedan till Avancerat läge och välj ett “CPU” – objekt;
  • utvärdera aktuell mättnad i MHz (användning);
  • överstiger den 75%, eller toppen är 90%? Om så är fallet, kanske du saknar värdprocessorresurser. Verifiera CPU redo för VM på den här värden som jag gjorde nedan. Om en genomsnittlig mättnad av centralprocessorn inte överstiger 75%, är nästa för dig att titta på!

CPU klar verifiering:

  • om du håller på att felsöka prestandan för den specifika VM, börja med den. Annars väljer du en värd, flyttar till virtuella maskiner, sorterar ut listan som i värd CPU — MHz (kolumn till kolumn) och tittar på en eller två virtuella datorer från början av listan;
  • för att mäta CPU Ready, välj en VM, flytta till prestanda, byt till Avancerat läge och byt sedan till att granska “CPU” (om du ska felsöka prestanda för den specifika VM, börja med den);
  • utvärdera redo för alla VM “objekt”. “Object” är en separat virtuell processor av VM. Du måste ändra egenskaperna för “Diagramalternativ…” för att bilda det;
  • överstiger minimalt eller genomsnittligt Redovärde för någon virtuell processor 2000ms? Om så är fallet saknar du värdprocessorresurser.

potentiellt problematiska parametrar som behöver verifieras:

  • gäst CPU mättnad verifiering;
  • aktiv VM minne byta verifiering;
  • VM Swap vänta verifiering;
  • VM minne komprimering verifiering;
  • överbelastad lagringsenhet verifiering;
  • tappade Mottagningspaket verifiering;
  • tappade Sändningspaket verifiering;
  • en vCPU i en SMP VM verifiering;
  • VM CPU redo i värden med genomsnittlig belastning verifiering;
  • långsam eller överbelastad lagringssystem verifiering;
  • Top lagringssystem belastning verifiering;
  • Peak network verifiering av dataöverföring;
  • verifiering av låg VM-processor mättnad;
  • tidigare verifiering av byte av VM-minne;
  • verifiering av hög resurspool för minne;
  • verifiering av hög värdminne;
  • hög Gästminne efterfrågan verifiering;
  • hög Timer-Avbrottsfrekvens verifiering;
  • numa Inställningar verifiering;
  • hög VM snapshots svarstid verifiering;

Diskundersystemproblem

kort sagt kan du begränsa lagringssystemproblem till:

1. Ett lagringssystem är överbelastat;

  • vilka är orsakerna till att ett lagringssystem kan bli överbelastat? Tja, de primära är ganska enkla, oavsett om det skulle vara fel konfigurationer (mängd och typ av enheter/RAID-nivå/caching/etc) eller mycket hög belastning.
    det finns ingen universell lösning, så jag ska bara sätta på min kapten uppenbara uniform och lista ner saker du förmodligen redan vet:
  • Bygg ditt lagringssystem med avseende på prestanda, inte bara kapacitet;
    ta hänsyn till att när du går virtuellt kan lasttypen växla också (från konsekvent till slumpmässig);
    har i butiksverktyg för att övervaka lagringssystemets diskprestanda, du måste titta på den tillsammans med esxtop;
  • (esxtop – VMware Console Tool, fungerar bra för att övervaka lagringsprestanda. Logga in på SSH-sessionen och börja. För dig som brukar använda resxtop: du måste ladda ner vMA eller vSphere CLI för Linux och starta det här verktyget därifrån. Men för att vara rättvis är den senaste versionen universell för den fungerar med både ESX och ESXi;
  • det finns också ett lysande vscsistats-verktyg;
    om du undrar varför lagringssystemet fungerar så långsamt kan du räkna ut det med Fio synthetic load;
    Tänk på att vissa applikationer kan sänka sina diskkostnader om du ger dem mer Minne.

2. Långsamt lagringssystem;
gör i princip allt från listan ovan!

3. Lagringssystem förseningar;
3 enkla lösningar:

aktier;
gräns IOPS;
Trängseltröskel (Lagring Io kontroll).

4. Dåliga diskar;
kontrollera din disk/ nätverkslagring regelbundet, och om något skulle misslyckas eller gå in i datum, byt ut det omedelbart. Du borde dock veta att i vissa fall, särskilt när skivan har misslyckats, kan du börja kontrollera (ytterligare användning av RAID-minne) andra diskar till samma öde = döm hela RAID.

5. ESXi OS;
Använd separata diskar för ESXi-värd OS, växlingspartitionen och virtuella datorer som finns på en lokal datalager. Tänk också på att använda RAID för att förbättra läs-och skrivprestanda.

6. Snapshots;
ta bort oanvända eller överflödiga ögonblicksbilder, det är inte valfritt. Du måste veta nu att ju fler ögonblicksbilder du har, desto större blir diskkostnaderna med I / O-aktiviteten.

7. Kryptering;
använd endast diskkryptering när det behövs! Kryptering leder till omkostnader, omkostnader leder till minskad prestanda, och vi vill inte ha det, gör vi nu?

(om du är intresserad av mer information är du välkommen att slå upp det själv)

små Tips

distribuera vRealize Operations Manager för en djupare bedömning av din miljö

denna vRealize Operations Manager är en VMware-produkt som är avsedd för komplex övervakning och hantering av VMware vSphere virtuell infrastruktur. Leverantören har lovat en integrerad felsökning. Du kan ladda ner den här.

Ställ dig själv en fråga: är VM verkligen beter konstigt?

en VM som utsätts för en tung arbetsbelastning kan ibland se ut som det ger bort dålig prestanda. Till exempel kan virtualiserade instanser av SQL-servrar eller dåligt skrivna SQL-frågor sakta ner din prestation big time! E-postservrarna med stora användarbaser kan också vara lite av ett problem i detta avseende. Lyckligtvis hjälper prestandaövervakningsdiagrammen i vSphere Web client dig att mäta resursutnyttjandet inom en viss period så att du kan bekräfta om det oroande beteendet var en engångs sak eller pågående och för att avgöra om det förväntas eller inte under sådana omständigheter. MS SQL och Exchange Server tar upp något RAM från VM: s gäst OS de kan hitta, särskilt om dynamisk minnesallokering är konfigurerad.

Analyze I/O Workloads to Determine Storage Performance Requirements

senaste uppdateringarna och senaste versionerna

uppdateringar och senaste utgåvor behandlar oftast prestandaproblem med fasta buggar, förbättrade drivrutiner och kod. Ändå, lita på mig på den här; ibland, den senaste versionen gör det ännu värre! Så håll dig orolig och testa tills du är säker. Eller åtminstone låta andra försöka arbeta med det, så att du kan fatta ett beslut som var genomtänkt.

antivirusprogram ESXi

du har större chans att stöta på en enhörning, men det finns faktiskt fall när du kan hitta antivirusprogram som körs på ESXi (vShield). Inget behov av att förklara vidare att en sådan sak kan påverka VM-prestanda på flera sätt om den inte är korrekt konfigurerad. Du måste också komma ihåg att det inte finns någon anledning att köra antivirusprogram på ESXi på grund av dess lilla fotavtryck och inbyggda säkerhetsfunktioner. Jag skulle föreslå att det skulle vara mycket bättre om anti-malware program som skall förpassas till VM: s gäst OS. Om du måste installera AV PÅ ESXi, gör det till en punkt att utesluta VM-filer som VMDKs från skanningsscheman, särskilt under topputnyttjande timmar.

är CPU-strömhantering aktiverad?

CPU – strömhantering, om den är aktiverad på ESXi-servrar, kan leda till hastighetslatensen, som i sin tur kan hämtas av applikationer eller arbetsbelastningar vilket resulterar i långsammare prestanda. Om du tror att det här är roten till problemet måste du kolla upp det med leverantörens dokumentation om att inaktivera CPU-strömhantering. Om det har noll effekt, återaktivera det och gör en hälsokontroll ett par gånger (mer information här)

Strömbatteri för Bios och SCSI-styrenheter

Kontrollera ett strömbatteri för Bios-delsystemet i din ESXi-värd, om specifikationerna tillåter det, även för SCSI eller de andra styrenheterna. SCSI-cache kräver ofta extra ström för arbete, och strömbatteriet på styrkortet ger vanligtvis det. Även om specifikationerna hävdar att det är en reservkraftplan, har jag upptäckt att strömbatteriets underspänning leder till misstag i styrenheternas arbete, och jag lyckades bara fixa det genom att byta ut det.

några råd i slutet:

  • gör en hälsokontroll av all fysisk arkitektur för ditt lagringssystem, inklusive iSCSI-switchar, nätverk och optiska kablar etc.
  • kontrollera omkopplarloggarna för att se till att det inte finns några fel eller andra olyckliga händelser som händer med lagringssystemet eller själva enheten.
  • Ping din iSCSI från dina VMkernel adresser, bara för att se till att ansluta till iSCSI är inga problem.
  • gör en hälsokontroll för SAN själv-vara säker på att det inte finns några misslyckade diskar, storage controller failover händelser, eller andra misstag som kan påverka prestanda.
  • kontrollera ledigt diskutrymme på varje LUN som är ansluten till dina ESXi-värdar.

slutsatser

jag vet, VMware vSphere ESXi felsökning kan se lite skrämmande. Men med exakt dokumentation, en god förståelse för din infrastruktur och några effektiva inbyggda verktyg kan du åtgärda eventuella problem som stör dina virtuella maskiner. Stanna bara ett ögonblick och tänk var exakt och vilket problem har du, och ta reda på vilken del av systemet som orsakar problem. Jag hoppas att Verktyg, kommandorad ESXTOP, esxcli och sist men inte minst vRealize Operations Manager skulle kunna hjälpa dig om behovet någonsin uppstår. Tveka inte att fråga VMware eller leverantörens tekniska support om hjälp. Mycket ofta kan de hjälpa dig att fixa det otroligt snabbt.

Leave a Reply