11 Problemas Diários de Rede

Em um dia normal como administrador de sistema, os nossos colegas, supervisores e clientes constantemente nos procuram em busca de respostas a perguntas comuns. Frequentemente respondemos a perguntas semelhantes, que se dividem em três categorias básicas:

A REDE E SUAS NECESSIDADES EM UM RELANCE

1. Por que as minhas aplicações estão tão lentas e o que aconteceu com o meu processo da noite passada? Quando é que você atualizará nosso hardware para resolver esses problemas?

2. Por que o meu Outlook não está recebendo e-mails?

3. Por que recebo alertas sobre tempos de inatividade, embora meus colegas já estejam efetuando a manutenção?

GARANTIR A QUALIDADE E A SEGURANÇA DA SUA REDE

4. Você tem certeza de que a nossa rede realmente é segura e que nenhuma pessoa não autorizada está acessando a rede?

5. Como podemos ter certeza de que nossos equipamentos na sala de servidores estão a salvo de ameaças externas?

6. Você sabia que o nosso site é inaceitavelmente lento e que os clientes muitas vezes abandonam os processos de compra?

7. Por que a qualidade de som de chamadas telefônicas é tão ruim, e você pode, por favor, corrigir a lentidão permanente dos meus fluxos de vídeo?

MANTER SEUS SISTEMAS BÁSICOS EM FUNCIONAMENTO 

8. Por que o nosso banco de dados funciona tão mal todas as manhãs?

9. Por que a minha virtual machine (máquina virtual) falha tanto?

10. Você pode me mostrar o estado de todas as minhas soluções de backup numa tacada só?

11. Por que eu sempre tenho que, primeiro, ligar para você, toda vez que o toner de nossa impressora está vazio?

Você tem que lidar com essas questões de forma rápida e abrangente. E, para isso, precisa de algo que lhe dê as respostas necessárias na palma da sua mão.

Talvez você já conheça as inúmeras listas do PRTG que facilitam a vida do administrador de sistema: dispositivos favoritos, melhor tempo de atividade, ping mais rápido, maior uso de largura de banda, páginas web mais lentas, maior disponibilidade de espaço em disco, sensores com status inativos etc. Pode-se usá-las para inspecionar toda a rede e, assim, manter tudo sob controle. Mas, você sabia que realmente há muito mais que o PRTG pode fazer? Aqui está uma lista útil de mais onze questões cotidianas que o PRTG pode resolver, para ajudá-lo a abordar rapidamente algumas das questões mais comuns de rede.

A rede e suas necessidades em um relance

Sua infraestrutura de TI precisa de uma revisão constante, para garantir a boa saúde dos dispositivos e do sistema. Há componentes sobrecarregados, como, por exemplo, CPU ou memória? A temperatura de seus servidores é aceitável? Há servidores Windows que ocasionalmente se reiniciam durante a noite? Você está ciente desse problema, ou falt-lhe o indício de que algo está errado? Você também quer saber quando os discos rígidos em seu ambiente estão se aproximando da capacidade máxima, quando a memória está baixa, ou quando sua conexão de internet precisa ser ampliada devido ao aumento do uso de largura de banda. Conhecer as condições da rede, possibilita que você saiba quando é a hora adequada para investir em novos recursos de hardware.

O PRTG fornece dados de monitoramento e relatórios históricos detalhados sobre todos os componentes da rede. Ao analisar esses dados, pode-se ver as tendências de uso para, assim, prever quando os recursos se esgotarão. O PRTG também pode avisá-lo com uma notificação imediata quando algo incomum ocorre, como uma falha de servidor, ou quando certos valores chegam a um limite definido. Dessa forma, você pode reagir antes que as coisas piorem.

FIGURA: Um relatório para sensores ping


Reiniciar automaticamente serviços e servidores Windows com problemas

Ao monitorar os serviços do Windows, se um deles falhar em um servidor, o PRTG irá enviar-lhe uma notificação por SMS, e-mail etc. Um dos métodos mais comuns para a recuperação é reiniciar manualmente todo o servidor para restaurar o serviço. O mesmo vale para bloqueios ocasionais do sistema. Nesse caso, os serviços do Windows param, o PRTG reconhece isto e envia uma notificação, solicitando que você reinicie os serviços.

Mas, não seria ainda mais eficiente se a reinicialização ocorresse automaticamente? Na verdade, com o sistema de notificação do PRTG, isso é possível. Basta criar um script que reinicia serviços, ou todo o sistema, e invoca uma notificação do tipo “Executar Programa”. Uma vez configurado, se um serviço ou servidor estiver inativo por um período definido de tempo, o PRTG executa o script e reinicia o serviço ou o servidor automaticamente, sem nenhuma intervenção. Ao monitorar os serviços específicos do Windows via sensor de Serviço WMI do PRTG, você pode escolher uma opção de reinicialização automática, mesmo se um serviço não estiver funcionando!

Eliminar alertas inúteis e irritantes durante os tempos de inatividade planejados

Às vezes, é necessário interromper o funcionamento de certos dispositivos para  manutenção e outras questões. Ou talvez você desligue os sistemas para o fim de semana ou à noite, ou simplesmente não deseja ser notificado em determinados momentos. Claro, o PRTG foi projetado para notificá-lo em caso de falhas para manter a máxima disponibilidade do sistema, mas receber alertas durante um período planejado de manutenção é simplesmente inútil. No entanto, pausar manualmente o monitoramento de determinados sensores em uma grande rede não é algo prático.

Felizmente, nossos desenvolvedores implementaram um recurso dedicado para manutenção e outras paradas planejadas. Para cada grupo, dispositivo ou qualquer outro objeto, o PRTG permite definir horários para limitar o tempo de monitoramento automaticamente. Isso evita falsos alarmes e elimina notificações irritantes durante o tempo de inatividade planejado.

FIGURA: Programações ajustáveis

Garantir a qualidade e a segurança de sua rede

Detectar problemas de segurança em sua rede

Como você pode ter certeza de que sua rede é segura? Por um lado, é importante que os programas antivírus sejam executados em todos os computadores e que eles estejam atualizados. Além disso, deve-se executar a versão mais recente do Windows, com as últimas atualizações de segurança. Mas, apesar desses esforços, pode ser que você já esteja sob ataque.

Picos incomuns no uso de CPU e tráfego podem indicar que há um potencial ataque. Felizmente, o PRTG detecta tal comportamento e muda os sensores correspondentes para o status “incomum”, alertando-o de que algo pode estar errado. Você também pode verificar manualmente as conexões à sua rede: há conexões através do seu firewall com endereços de origem desconhecidos? É recomendável analisar isso rotineiramente por meio do recurso Toplists de vários sensores de tráfego para ficar no lado seguro.

Outro recurso útil para monitoramento de segurança é a Análise de Sensor Similar, o que pode ajudar a reconhecer as interconexões estranhas entre os sensores. Além disso, o PRTG monitora o status de segurança geral como o software antivírus de um computador com Windows com o sensor WMI Security Center e atualizações de servidor Windows com o sensor WSUS Statistics.

FIGURA: Análise das conexões através do packet sniffer


Manter seguro o seu centro de dados

Altas temperaturas, umidade, vazamentos de água, inundações, fogo, fumaça, raios de sol – há inúmeros tipos de condições potencialmente prejudiciais que podem danificar sua sala de servidores ou equipamentos do centro de dados. Se o ar-condicionado parar de funcionar, as temperaturas podem subir rapidamente até um ponto crítico e os servidores podem superaquecer-se em pouco tempo. Uma vez que, ao contrário de você, eles não podem simplesmente correr até a esquina e comprar um sorvete para um resfriamento rápido, é importante que ser proativo ao invés de reativo. O monitoramento dos valores ambientais é importante para certificar que seus dispositivos estejam seguros.

Ao monitorar vários sensores de hardware quanto à temperatura, umidade etc., o PRTG o notificará em caso de valores excepcionalmente elevados. Por exemplo, se uma caixa de sensor APC registrar mais de 27° C, o sensor da Biblioteca SNMP aplicado pode mostrar o status de alerta e notificá-lo para cuidar do problema. Talvez o ar-condicionado esteja com um problema? Com o PRTG e um cabo do sensor de hardware correspondente ligado ao aparelho de ar condicionado, isso pode ser detectado facilmente a partir de seu computador.

Além dos fatores ambientais, pessoas não autorizadas também podem ter um impacto crítico sobre a segurança da sua infraestrutura, e, naturalmente, não devem ter acesso a áreas sensíveis na sua empresa. Usar o PRTG em combinação com os sensores de hard-
ware correspondentes, pode ajudá-lo a garantir que todas as câmeras de observação estejam em execução, e que todas as portas e janelas estejam trancadas, bem como alertá-lo sobre eventuais problemas.

Garantir a disponibilidade e evitar o mau desempenho de páginas web

Disponibilidade e tempos de carregamento de páginas web são um ponto crucial para os negócios diários de qualquer empresa. E, para isso, é necessário que o site esteja acessível dia e noite com um desempenho adequado. Para lojas online, é extremamente importante que as demandas do site funcionem conforme o esperado. Se um processo de compra falha devido a erros técnicos ou se os itens de navegação na sua página são uma experiência horrível, você certamente perderá clientes e dinheiro. O mesmo vale se os clientes potenciais tentam obter informações sobre a sua empresa e a respectiva página está inaceitavelmente lenta.

O PRTG ajuda a evitar a possível perda de receitas para a sua empresa, alertando-o imediatamente se houver algo errado com a sua página web ou em caso de comportamento incomum, como  desempenho lento. Use o Sensor HTTP de Página Web Total, por exemplo, para monitorar o tempo de carregamento da página inteira, ou o Sensor de Transação HTTP para medir o tempo de carregamento para a realização de transações comerciais em uma página web interativa. Ou, adicione um Sensor HTTP Apache ModStatus para monitorar o acesso e dados transferidos para identificar picos de tráfego em horários específicos, para que você saiba quando é a hora de providenciar mais largura de banda.

FIGURA: Gráfico PRTG ao vivo para os tempos de carregamento de uma página web


QoS: Qualidade do som em VoIP e travamentos em streaming de video

Quando a qualidade do som do Voice over IP (VoIP) cai drasticamente ou o fluxo (streaming) de vídeo interrompe-se com muita frequência, é preciso investigar a causa. Poderia ser tremulação, perda de pacotes ou variação de atraso de pacotes da conexão de rede? Tanto o VoIP quanto o streaming de vídeo dependem fortemente de um fluxo constante de pacotes de dados, e a qualidade do serviço é afetada se os pacotes UDP não são recebidos em tempo hábil, perdem-se ou estiverem fora de ordem.

O PRTG é a ferramenta perfeita para resolver esses problemas. Com o sensor Qualidade de Serviço (QoS) pronto para uso, você pode medir a qualidade de sua conexão de rede através do envio de pacotes UDP entre duas sondas remotas e analisar diferentes parâmetros de rede. Você também pode monitorar os parâmetros relevantes para VoIP através dos resultados IP Service Level Agreement (SLA) obtidos nos dispositivos Cisco. Basta adicionar o sensor Cisco IP SLA do PRTG para garantir que o desempenho da rede esteja adequado para VoIP. 

Manter seus Sistemas Básicos em Funcionamento

Corrigir problemas de mau desempenho do banco de dados

Se o desempenho do banco de dados está baixo, é preciso avaliar a causa, a fim de otimizá-lo desempenho. Infelizmente, examinar a razão para um mau desempenho do servidor SQL, por exemplo, pode ser uma tarefa difícil.

O suporte de manutenção de banco de dados do PRTG pode ajudar nisso. Por exemplo, se o desempenho do SQL estiver baixo em momentos específicos, isto pode ser resultado de um número excessivamente elevado de conexões simultâneas de usuários. Os sensores para servidores SQL Microsoft WMI do PRTG podem mostrar-lhe o número de conexões de usuário e a porcentagem de páginas encontradas no cache buffer sem ter que ler a partir do disco. Se o PRTG indicar que esse número está muito baixo, a quantidade de memória disponível para o servidor SQL pode ser aumentada. Ou talvez você esteja enviando consultas ineficientes? O PRTG mede o tempo de resposta das consultas e pode verificar, se o valor de resposta é o esperado.

Corrigir um comportamento não confiável em ambientes virtuais

É importante monitorar continuamente as máquinas virtuais em infraestruturas de TI altamente flexíveis, onde a virtualização desempenha um papel importante. Problemas com máquinas virtuais podem ter várias causas, e o PRTG fornece vários sensores para detectar e tratar destas questões. Adicionar um sensor de máquina virtual VMware do PRTG, permite monitorar a CPU e o uso de memória de máquinas virtuais através do SOAP assim como a velocidade de rede de uma única máquina virtual.

Mas o que fazer se a velocidade estiver muito lenta ou a memória sobrecarregada em uma máquina virtual? O PRTG também permite monitorar o hardware do host, para detectar imediatamente se problemas com máquinas virtuais originam-se de uma falha do hardware do host. Por exemplo, se o estado geral do seu host VMware não estiver „normal“, o problema será relatado na mensagem de sensor. Devido à característica de dependências do PRTG, você pode rapidamente determinar se uma única VM ou o hardware está causando o problema.

FIGURA: Sensores para monitoramento VMware


Garantir um backup de forma rápida e fácil

Backups de virtualização. Backups do sistema operacional e de imagem completos. Backups de SQL e Exchange. Backups de tape e online. Mesmo em pequenas empresas, manter uma visão geral de todos os backups – que estão sendo executados em sua rede – pode ser relativamente difícil. Você poderia responder imediatamente a esta pergunta: qual é o estado atual do seu sistema de armazenamento NetApp ou sua solução de backup Acronis True Image?

A maioria das soluções de backup envia e-mails que indicam seu estado todas as noites, mas não é prático analisar toneladas de e-mails todos os dias, a fim de identificar potenciais problemas de backup. Deixe isso por conta do PRTG e reduza sua carga de trabalho. Basta configurar seu software de backup para enviar e-mails para uma conta de e-mail dedicada e, em seguida, ajustar o sensor IMAP do PRTG em conformidade. Dessa forma, o PRTG mantém o controle sobre todos os seus backups e você economiza tempo ao ter certeza de que todos os backups foram bem-sucedidos.

Eliminar a manutenção demorada das impressoras

Como administrador do sistema, você realmente quer desperdiçar o seu tempo precioso verificando manualmente o status das impressoras em sua infraestrutura de TI todos os dias?  Também é irritante ser interrompido durante trabalhos que exigem concentração – como, por ex., abordar problemas com o servidor SQL sobre os quais o PRTG o notificou recentemente – simplesmente por causa de um compartimento de papel vazio na impressora do andar de cima.

O PRTG fornece a solução: use o sensor Windows Print Queue para monitorar todas as tarefas em um servidor de impressão. Se o papel estiver se esgotando, você recebe um alerta do PRTG e pode reagir antes que seus colegas comecem a reclamar. O PRTG pode até mesmo monitorar os parâmetros de hardware das impressoras HP LaserJet com um sensor original disponível. O sistema pode enviar uma notificação quando o toner estiver baixo, ou, melhor ainda, o PRTG pode enviar automaticamente um e-mail ao seu fornecedor para trazer novos toners e trocar o antigo. Com o PRTG, as preocupações de status da impressora podem ser eliminadas por completo, para que você possa se concentrar em trabalhos mais importantes.

Resumo

Uma solução de monitoramento de rede, como o PRTG Network Monitor, ajuda o administrador a gerenciar os desafios de seu trabalho cotidiano. Ele apresenta um suplemento altamente vantajoso para a infraestrutura de uma rede, pois, por um lado, proporciona um grande alívio para o departamento de TI e, por outro, ainda é capaz de revelar possibilidades de otimização anteriormente não detectadas.

Um software de monitoramento de rede – que monitora constantemente os processos na rede, realiza a análise e alerta o pessoal de TI assim que um erro ocorre ou quando valores críticos forem excedidos – é altamente recomendado, para acompanhar-se em tempo real a disponibilidade, o desempenho e o uso de banda em uma rede de TI.