Dicas e Truques para Solucionar Pobres vSphere Desempenho

Introdução

Como qualquer outro admin, você sabe que o VMs, eventualmente, começar a sofrer interrupções, problemas de desempenho, ou simplesmente parar de responder. Isso é um fato da vida, infelizmente. Provavelmente, como engenheiro de virtualização, você provavelmente já encontrou esses problemas pelo menos uma vez. E como o ambiente virtualizado é um sistema bastante complicado, pode haver muitos motivos ou fatores diferentes que afetam o mau desempenho da VM. Tentar descobrir o que está errado pode levar muito do seu tempo.

hoje, tentaremos juntos determinar o que pode fazer com que sua infraestrutura VMware ofereça desempenho ruim e encontre maneiras de evitá-la.

então, o que você precisa para a solução de problemas adequada?

em primeiro lugar, registros. Os registros são o Santo Graal Na solução de problemas do ambiente vSphere. Eu sei, eu sei. Claro, você confia em sua memória 100% e, claro, você se lembrará de tudo o que precisa saber, como credenciais para fazer login ou qualquer outra informação necessária. No entanto, ainda assim, a última coisa que você deseja que aconteça quando seu servidor falhar repentinamente ou seus hosts ESXi estiverem sobrecarregados é nervosamente tentar lembrar senhas apenas para inserir um host ou vSphere vCenter.

além disso, qualquer documentação existente, como esquemas de cluster do vSphere, pode ser de grande ajuda. Se você realmente não sabe como todo o sistema está configurado, isso irá atrasá-lo muito. Naturalmente, nenhuma pessoa no mundo realmente gosta de manter registros, mas acredite, quando surgir a necessidade, você será grato por ter informações facilmente acessíveis. Agora, vamos dar uma olhada no que esta informação deve consistir em:

hosts ESXi:

  • nomes de Host / endereço IP
  • host ESXi versão e nível de patch
  • senha do Root (a mantê-lo em local seguro)
  • endereços IP Registados para armazenamento e interface
  • Host de descrição de hardware
  • configuração de Armazenamento (iSCSI, etc)
  • adaptadores de Rede (fornecedor, controlador de versão, etc.)

Opções de Armazenamento:

  • endereços IP usados
  • versão do Firmware
  • Credenciais (mantenha-a em local seguro)
  • configurações de Vlan

Matriz de Armazenamento:

  • endereço IP de SAN porta de gerenciamento
  • nível de Firmware
  • LUN configuração RAID nível, o número de unidades, dimensões, o firmware da unidade de
  • inícios de sessão e palavras-passe para a matriz de SAN interface de gerenciamento
  • Fornecedor específico SAN ferramentas de gestão (utilitários específicos)

Como você provavelmente pode reunir até agora, a documentação mais, melhor. Infelizmente, muitos administradores tendem a ignorar essa regra. Além disso, sua documentação não será muito útil se estiver desatualizada, por isso precisa acompanhar as alterações à medida que avançam.

com o que começar?

1. Estude cuidadosamente as melhores práticas de desempenho da VMware

este material permanece crítico e vital há dois anos. No início, há um esquema de solução de problemas. Os possíveis problemas são resolvidos de acordo com sua relevância (VMware Tools, CPU, etc) e sua variação (de 100% de efeito no desempenho a um mínimo). Se você usá-lo, ele pode ajudá-lo muito a melhorar sua infraestrutura.

2. Ferramentas VMware?

certifique-se de que as ferramentas VMware estão instaladas, atualizadas e em execução em cada uma das suas VMs. Basicamente, o pacote VMware Tools é um conjunto de drivers de dispositivos virtuais que afetam o desempenho da máquina virtual (geralmente para melhor, é claro).

Verifique a instalação do VMware Tools.

  • selecione um host no vSphere Web Client;
  • vá para a guia Máquinas Virtuais;
  • adicione a coluna “VMware Tools Status”;
  • verifique o status. Se disser OK, comece a procurar uma próxima maneira de melhorar o desempenho.
  • não está em execução / desatualizado-instale o VMware Tools.

se as ferramentas VMware não estiverem iniciando, você precisará corrigir o sistema operacional convidado, pois é aí que o problema pode estar. É a atualização do kernel do Linux ou alguém por algum motivo teve o VMware Tools no Windows desativado.

se a versão atual do VMware Tools estiver desatualizada, você precisará fazer uma atualização usando o menu de contexto do vSphere Web Client. Normalmente, isso se torna um caso depois de instalar as atualizações mais recentes nos hosts ESX/ESXi. Quando terminar com eles, não se esqueça de manter as ferramentas VMware atualizadas também. No geral, com o vSphere Web Client, você pode verificar facilmente suas ferramentas VMware, como o seguinte esquema sugere:  vSphere Web Client

a exibição de status do vmtools para VMs.
você pode adicionar vmtools clicando no botão direito do mouse sobre o Título e selecionando-o em conformidade.

Vmtools status
no entanto, você também pode aplicar o cenário PowerCLI, que verifica a presença do pacote vmtools e seu estado atual. A maior parte das propriedades relacionadas ao vmtools é encontrada em < vm >.convidado.extensiondata.

VMWare PowerCLI para ESXi e o vSphere

PowerCLI para o VMware vSphere é uma ferramenta incrivelmente poderosa, com base no Microsoft PowerShell/ PowerCLI permite uma execução de 98% de manual de tarefas para gerenciar a infraestrutura virtual a partir da linha de comando. Como ferramenta, O PowerCLI permite centralizar o gerenciamento operacional do ESXi e do vCenter Server na linha de comando. Graças a este maravilhoso utilitário, você é capaz de criar cenários, monitorar o estado de VMs, armazenamento, redes, contas de usuário e, a cereja no bolo, automatizar uma grande parte dos processos operacionais. Você pode instalar o PowerCLI em máquinas com Microsoft Windows 7 / Windows Server 2008 R2 e superior, mas o que é mais interessante, existem várias versões para diferentes kits Linux.O PowerCLI consiste em mais de 1900 cmdlets para o gerenciamento de infraestrutura VMware virtual e em nuvem (vSphere, vSAN, vRealize Operations Manager, vCloud Director, Site Recovery Manager, Horizon 7 e vCloud Air). Ao executar o cmdlet, você endereça a API no host ESXi selecionado ou no servidor vCenter. Boas notícias: você pode baixar o patch mais recente do VMware PowerCLI no site oficial da VMware (sim, é claro, você precisará de uma conta para isso).  VMware PowerCLI para continuar com o console PowerCLI, basta iniciar o atalho VMWare vSphere PowerCLI como administrador. PowerCLI console

Problemas Básicos

1. A falta de recursos para a VM

eu sei, eu sei, reconhecidamente, ter recursos suficientes para que a VM funcione com eficiência é um must-have. No entanto, você ficaria chocado com quantos VMs não recebem recursos suficientes de acordo com os requisitos do sistema operacional convidado e os aplicativos em execução sob ele. Quero dizer, você deve saber como a parte de trás de sua mão que, apesar dos inúmeros benefícios que a virtualização traz para a mesa, sempre há despesas gerais a serem enfrentadas. Tipo, o que a VM fará se ficar sem RAM? Naturalmente, sua máquina começará a Trocar para o disco com muito mais frequência. Se o armazenamento subjacente estiver cheio, o desempenho sofrerá um grande golpe. É por isso que, sempre que você tiver a chance de fazer isso, use reservas, pools de recursos, DRS e tudo o que puder para garantir que a quantidade correta de recursos seja atribuída a uma VM para obter a máxima eficiência operacional.

2. Monitoramento de desempenho

basicamente, o monitoramento de desempenho é uma função incorporada em clientes vSphere. Este aqui é uma daquelas ferramentas necessárias que o ajudarão a examinar problemas relacionados ao desempenho. É tão bom porque permite que você use alarmes sempre que possível, então você está sempre um passo à frente de qualquer problema de desempenho. Vmware ESXi

tenha em mente, no entanto, que ao trabalhar no host ESXi local, você pode acessar apenas a guia Desempenho. Se você quiser mais detalhes, use VMware ® vSphere vCenter.  VMware ® vSphere vCenter SUPER importante. Desempenho e desempenho avançado são mais do que Ferramentas de diagnóstico eficazes e informativas. Se você usá-lo direito, você não terá problemas para encontrar o ponto fraco do seu sistema.

vamos tomar a saturação da CPU do pool de recursos como exemplo. Para procurar detalhes:

  • escolha pool de recursos e vá para o desempenho. Em seguida, mude para Avançado e selecione objeto CPU;
  • avalie a saturação atual em MHz (uso);
  • Compare o valor da limitação do pool de recursos e a saturação atual. Se estiver perto do limite, existe a possibilidade de você não ter recursos e tudo o que você precisa fazer é reavaliar o valor pronto da CPU das VMs separadas neste mesmo pool;

verificação pronta para CPU:

  • para CPU pronto. selecione uma VM, vá para o desempenho, Escolha o Modo Avançado e mude para a revisão de “CPU” (se você estiver pronto para solucionar problemas de desempenho da VM específica, comece com essa);
  • avalie pronto para todos os “objetos”da VM. “Object” é um processador virtual separado da VM. Você precisará alterar as propriedades das “opções de gráfico …” para imaginá-lo;
  • Diga-me, o valor mínimo ou médio pronto para qualquer processador virtual excede 2000ms? Se sim, quando, está tudo claro agora. Você simplesmente não tem recursos do processador por causa do limite definido para seu pool de recursos;
  • agora apenas faça o mesmo para o resto das VMs neste pool.

verificação de saturação da CPU do Host:

  • selecione o host, vá para o desempenho, mude para o Modo Avançado e escolha um objeto “CPU”;
  • avalie a saturação atual em MHz (uso);
  • ele excede 75% ou o topo é 90%? Nesse caso, talvez você não tenha recursos do processador host. Verifique a CPU pronta para a VM neste host, como fiz abaixo. Se uma saturação média do processador central não exceder 75%, a próxima é para você olhar!

verificação pronta para CPU:

  • se você estiver pronto para solucionar problemas do desempenho da VM específica, comece com essa. Caso contrário, selecione um host, mover Máquinas Virtuais, ordenar a lista como na CPU do Host — MHz (coluna a coluna), e dar uma olhada em uma ou duas máquinas virtuais a partir do início da lista;
  • medir até CPU Pronto, seleccione uma VM, mover para o Desempenho, alternar para o modo Avançado e, em seguida, alternar para a revisão de “CPU” (se você está pronto para resolver o desempenho da VM específica, comece com que um);
  • Avaliar Pronto para todas as VM “objetos”. “Object” é um processador virtual separado da VM. Você precisará alterar as propriedades das “opções de gráfico…” para imaginá-lo;
  • o valor mínimo ou médio pronto para qualquer processador virtual excede 2000ms? Nesse caso, você não tem recursos do processador host.

Potencialmente problemático parâmetros que precisam de verificação:

  • Convidado CPU Saturação de Verificação;
  • Active VM Troca de Memória de Verificação;
  • VM Swap Aguarde a Verificação;
  • VM Memória de Compressão Verificação;
  • Sobrecarregado Dispositivo de Armazenamento de Verificação;
  • Caiu Receber Pacotes de Verificação;
  • Caiu Transmissão de Pacotes de Verificação;
  • Uma vCPU em um SMP VM Verificação;
  • VM CPU Pronto no host com carga média de Verificação;
  • Lentos ou sobrecarregados Sistema de Armazenamento de Verificação;
  • Top de Armazenamento de Carga do Sistema de Verificação;
  • Pico da rede de transmissão de Dados de Verificação;
  • Baixo VM processador de Saturação de Verificação;
  • Passado VM Troca de Memória de Verificação;
  • Alta Recurso de memória de Pool de Verificação de demanda;
  • Alta Host memória Verificação de demanda;
  • Alta Memória do Convidado Verificação de Demanda;
  • Alta Timer de Interrupção de Taxas de Verificação;
  • NUMA configurações de Verificação;
  • Alta VM instantâneos tempo de resposta de Verificação;

Subsistema de Disco de Problemas

Em resumo, você pode restringir o sistema de armazenamento de problemas para baixo:

1. Um sistema de armazenamento está sobrecarregado;

  • quais são as razões pelas quais um sistema de armazenamento pode ficar sobrecarregado? Bem, os principais são bastante simples, sejam configurações erradas (quantidade e tipo de dispositivos/nível RAID/cache/etc) ou carga muito alta.
    não Há solução universal, então eu vou apenas colocar no meu Capitão Óbvio uniforme e a lista de coisas que você provavelmente já sabe:
  • Construir o seu sistema de armazenamento com relação ao desempenho, não só a capacidade;
    Levar em conta que quando você for virtual, o tipo de carga pode mudar também (consistente para aleatórios);
    tem na loja utilitários para monitorar o sistema de armazenamento de desempenho de disco, você precisa assistir junto com esxtop;
  • (Esxtop – o VMware ferramenta de console, funciona bem para monitorar o desempenho do armazenamento. Faça login na sessão ssh e inicie. Para aqueles de vocês que tendem a usar resxtop: você terá que baixar VMA ou vSphere CLI Para Linux, e iniciar esta ferramenta a partir daí. Mas para ser justo, a última versão é universal, pois funciona com os ESX e ESXi;
  • além disso, há uma brilhante vSCSIStats utilitário;
    se você está Se perguntando por que o sistema de armazenamento é trabalhar de forma lenta, você pode descobrir isso com FIO sintético de carga;
    tenha em mente que determinadas aplicações pode diminuir o seu disco despesas gerais se você fornecê-los com mais memória.

2. Sistema de armazenamento lento;
basicamente, faça tudo da lista acima!

3. Atrasos no sistema de armazenamento;
3 soluções simples:

compartilhamentos;
limite IOPS;
limite de congestionamento (controle IO de armazenamento).

4. Discos ruins;
verifique seu armazenamento de disco/ rede regularmente e, se algo falhar ou ficar desatualizado, substitua-o imediatamente. No entanto, você deve saber que, em alguns casos, especialmente quando o disco falhou, iniciar a verificação (uso adicional de memória RAID) pode trazer outros discos para o mesmo destino = doom todo o RAID.

5. ESXi OS;
use discos separados para o sistema operacional host ESXi, a partição swap e VMs residentes em datastores locais. Além disso, pense em usar RAID para melhorar o desempenho de leitura e gravação.

6. Snapshots;
exclua quaisquer snapshots não utilizados ou redundantes, isso não é opcional. Você deve saber agora que quanto mais instantâneos você tiver, maiores serão as despesas gerais do disco com a atividade de E/S.

7. Criptografia;
use criptografia de disco somente quando necessário! A criptografia leva a despesas gerais, despesas gerais levam à diminuição do desempenho, e não queremos isso, nós agora?

(Se você estiver interessado em obter mais informações, você é bem-vindo procurá-lo a si mesmo)

Pequenas Dicas

Implantação de vRealize Gerente de Operações de uma profunda avaliação do seu ambiente

Este vRealize Operations Manager é um produto VMware designada para o complexo de monitoramento e gerenciamento de infra-estrutura virtual VMware vSphere. O fornecedor prometeu uma solução de problemas de trabalho integrada. Você pode baixá-lo aqui.

Faça uma pergunta a si mesmo: a VM está realmente se comportando de maneira estranha?

uma VM que está sujeita a uma carga de trabalho pesada às vezes pode parecer que está dando um desempenho ruim. Por exemplo, instâncias virtualizadas de servidores SQL ou consultas SQL mal escritas podem desacelerar seu desempenho! Os servidores de E-mail com grandes bases de usuários também podem ser um problema a esse respeito. Felizmente, os gráficos de monitoramento de desempenho no vSphere Web client o ajudarão a medir a utilização de recursos dentro de um período especificado para que você possa confirmar se o comportamento preocupante foi uma coisa única ou contínua e determinar se é esperado ou não em tais circunstâncias. O MS SQL e o Exchange Server estão ocupando qualquer RAM do sistema operacional convidado da VM que podem encontrar, especialmente se a alocação de memória dinâmica estiver configurada.

Analyze I/O Workloads to Determine Storage Performance Requirements

atualizações mais recentes e versões mais recentes

as atualizações e versões mais recentes geralmente abordam problemas de desempenho com bugs corrigidos, drivers aprimorados e Código. No entanto, confie em mim neste; às vezes, o último lançamento torna ainda pior! Portanto, fique alarmado e teste até ter certeza. Ou pelo menos deixe os outros tentarem trabalhar nisso, para que você possa tomar uma decisão que foi pensada.

software Antivírus ESXi

Você tem uma maior chance de esbarrar em um unicórnio, mas há casos, na verdade, quando você pode encontrar o software antivírus em execução no ESXi (vShield). Não há necessidade de explicar ainda que tal coisa pode afetar severamente o desempenho da VM de várias maneiras se não estiver configurada corretamente. Você também deve lembrar que não há razão para executar software antivírus no ESXi devido à sua pequena pegada e recursos de segurança embutidos. Eu sugeriria que seria muito melhor se o software anti-malware fosse relegado ao sistema operacional convidado da VM. Se você precisar instalar o AV no ESXi, faça questão de excluir arquivos de VM, como VMDKs, das programações de digitalização, especialmente durante o horário de pico de Utilização.

o gerenciamento de energia da CPU está ativado?

o gerenciamento de energia da CPU, se estiver ativado em servidores ESXi, pode levar à latência de velocidade, que, por sua vez, pode ser captada por aplicativos ou cargas de trabalho, resultando em desempenho mais lento. Se você acha que esta é a raiz do problema, você tem que verificá-lo com a documentação do Fornecedor sobre como desativar o gerenciamento de energia da CPU. No caso de que tem efeito zero, reativá-lo e fazer uma verificação de saúde de um par de vezes (mais detalhes aqui)

bateria do Bios SCSI e controladores

Verifique uma bateria de Bios subsistema de seu host ESXi, se as especificações permitem, também para SCSI ou outros controladores. O cache SCSI geralmente requer energia adicional para o trabalho, e a bateria de energia na placa do controlador geralmente a fornece. Mesmo que as especificações afirmem que é um plano de energia de backup, descobri que a subtensão da bateria de energia leva a erros no trabalho dos controladores e consegui corrigi-lo apenas por substituição.

Alguns conselhos no final:

  • Fazer uma verificação de saúde de toda a arquitetura física do sistema de armazenamento, incluindo iSCSI switches, redes e cabos ópticos, etc.
  • verifique os registros dos switches para garantir que não haja erros ou outros eventos infelizes acontecendo com o sistema de armazenamento ou o próprio dispositivo.
  • Ping seu iSCSI de seus endereços vmkernel, apenas para se certificar de que a conexão com iSCSI não é problema.Faça uma verificação de integridade para a própria SAN – certifique-se de que não há discos com falha, eventos de failover do controlador de armazenamento ou quaisquer outros erros que possam afetar o desempenho.
  • verifique o espaço livre em disco em cada LUN conectado aos seus hosts ESXi.

conclusões

eu sei, VMware vSphere ESXi solução de problemas pode parecer um pouco assustador. No entanto, com documentação precisa, um bom entendimento de sua infraestrutura e algumas ferramentas integradas eficientes, você pode corrigir qualquer problema que perturbe suas VMs. Basta parar por um momento e pensar onde exatamente e que problema você tem, e depois descobrir que parte do sistema está causando problemas. Espero que utilitários, ESXTOP de linha de comando, esxcli e, por último, mas não menos importante, o vRealize Operations Manager possa ajudá-lo se surgir a necessidade. Além disso, não hesite em pedir ajuda à VMware ou ao suporte técnico do Fornecedor. Muitas vezes, eles podem ajudá-lo a consertá-lo incrivelmente rápido.

Leave a Reply