Solução de Problemas de Falha na Atualização do Socket

Visão Geral

Falhas na atualização do Socket podem ocorrer em várias etapas, desde a implantação inicial até a janela de manutenção agendada e atualizações manuais. Entender e resolver esses problemas prontamente é crucial para manter a integridade da rede. Aqui está uma visão geral do processo de solução de problemas para lidar com falhas na atualização do Socket.

Sintomas

  • Falha na Atualização Inicial: Ocorre durante a implantação do Socket.
  • Problemas na Janela de Manutenção: Um grande número de Sockets não foi atualizado durante a manutenção agendada.
  • Túnel estabelecido após falha de atualização: A atualização do Socket falhou, mas o túnel permanece ativo.
  • Inacessibilidade Pós-Atualização: Sockets tornam-se inacessíveis após uma atualização.

Causas Possíveis

  • Problemas de Conectividade: Tempo esgotado devido a internet lenta ou configurações incorretas de MTU.
  • Falhas na Resolução de DNS: Incapacidade de resolver cc2.catonetworks.com.
  • Restrições de Firewall: Firewalls com inspeção SSL.
  • Limitações de Porta: Restrições WAN1/Porta1.

Remarcar Atualizações Automáticas

Se o motivo pelo qual a atualização foi ignorada foi devido a um link flutuante de ISP, que causou a atualização automática a ser ignorada para toda a conta, podemos pausar atualizações automáticas para o socket afetado e remarcar a atualização automática para a próxima janela de manutenção.

Uma vez que o problema tenha sido resolvido, podemos prosseguir para atualizar manualmente o socket problemático.

Solução de Problemas de Falha na Atualização do Socket

Nota

Nota: Antes de começar a solução de problemas, certifique-se de entender como as atualizações de Socket funcionam na Cato no artigo a seguir: Understanding Cato's Managed Socket Upgrade Service

As atualizações de Socket ocorrerão durante a janela de manutenção configurada no CMA ou durante a implantação inicial. Esta seção irá aprofundar nos passos envolvidos na solução de problemas de falhas na atualização do Socket. Existem principalmente três possíveis resultados para falhas de atualização:

  1. A atualização inicial do Socket falha durante a Implantação do Socket.
  2. O túnel permanece ativo e estabelecido, apesar da falha de atualização.
  3. O túnel não é estabelecido e o Socket se torna inacessível após a falha de atualização.

Falha na Atualização Inicial

Quando um Socket recém-implantado ou redefinido para as configurações de fábrica se conecta pela primeira vez à Internet, ele tentará continuamente alcançar a Cato através de sua porta WAN e tentará atualizar sua versão de firmware.

Para solucionar falhas na Atualização Inicial, consulte Troubleshooting Failed Initial Firmware Upgrade

 

Túnel está Estabelecido Após uma Falha de Atualização 

Durante uma janela de manutenção, o processo de atualização do Socket pode não ter sucesso, resultando em uma falha de atualização que impede que outros Sockets em toda a conta sejam atualizados. É importante identificar as atualizações que falharam e se concentrar em atualizá-las antes de agendar uma nova janela de manutenção.

Análise de Eventos CMA

Revise eventos relacionados a atualizações de Socket filtrando o Subtipo como Atualização de Socket e a Ação como Falhou

Eventos com ação Ignorado podem indicar que o Socket estava offline durante a janela de manutenção ou que um Socket diferente falhou na atualização (Nenhum túnel aberto após o tempo de tolerância), o que levou a todos os demais Sockets serem ignorados. O motivo para a ação ignorada pode ser visto na Mensagem do Evento. Por exemplo:

  • Atualização foi ignorada. Socket principal estava offline durante a janela de manutenção.
  • Atualização foi ignorada. Ignorada a atualização pendente para este Socket, porque um Socket diferente não conseguiu concluir a atualização.

Eventos com ação Falhou indicam que a atualização do Socket foi tentada, mas o processo de atualização em si falhou. O motivo para a ação falhada pode ser visto na Mensagem do Evento

Se o Socket se torna inacessível após esta falha, vá para Falha do Túnel ao Estabelecer após uma Atualização.

Continue o processo de solução de problemas concentrando-se em Sockets com ação Falhou.

Solução de Problemas de Falhas Durante a Atualização

Durante o processo de atualização, o Socket tentará baixar a imagem de firmware. Tempo esgotado pode ocorrer devido às seguintes razões:

  • Falha ao resolver DNS corretamente para cc2.catonetworks.com
  • Conexão de internet lenta ou pouco confiável impede o download do firmware.
  • Configuração de MTU incorreta nas interfaces WAN.

Para descartar as razões acima, verifique o seguinte:

  • Utilize a ferramenta de Ping do WebUI para confirmar que o Socket pode resolver cc2.catonetworks.com via o túnel. Se o FQDN não for resolvível, verifique as Configurações DNS na porta WAN.
  • Em Análise de Rede, verifique se o túnel apresentou perda de pacotes durante a janela de manutenção. Se sim, verifique se também há Perda de Pacotes na Última Milha e reporte esse problema ao ISP.
  • Sockets da Cato executam PMTUD (descoberta de MTU) com o PoP para determinar o MTU permitido sobre o túnel. No entanto, definir manualmente a MTU na interface WAN pode levar à fragmentação de pacotes e à degradação do desempenho. Verifique o valor configurado de MTU na WebUI.

Solução de Problemas de Falhas Após a Atualização

Uma vez que o firmware tenha sido baixado e instalado no Socket, o Socket entrará em um período de graça (10 minutos) onde várias verificações são feitas para determinar que a nova versão instalada é estável:

  • O processo do Socket está em execução.
  • O Ping funciona para cc2.catonetworks.com, 8.8.8.8 e Facebook pela Internet
  • A conexão com o PoP está estabelecida por pelo menos 5 minutos.
  • Houve pelo menos dez sincroniações bem-sucedidas entre o Socket e o PoP.
  • cURL funciona para cc2.catonetworks.com através do túnel.

Se as verificações não forem bem-sucedidas durante o período de graça, o Socket reverterá para a versão anterior, presumindo que a nova versão é instável. Assegure-se de que o Socket mantenha seu acesso à Internet por 10 minutos após a conclusão da atualização.

Executando um Reboot do Socket

Em algumas falhas de atualização Fatais, reiniciar o Socket pode ser útil antes de tentar novamente a atualização do firmware. Se o túnel ainda estiver ativo após a falha de atualização, um reboot remoto do Socket pode ser feito via WebUI na guia Administração.

Se o Socket estiver inacessível após a falha de atualização, vá para Falha do Túnel ao Estabelecer após uma Atualização.

Atualização Manual do Socket e Reagendamento

Sockets com ação Ignorada durante a janela de manutenção podem ser atualizados manualmente da CMA uma vez que o Socket esteja online novamente. Sockets com ação Falhado devem seguir as etapas de solução de problemas acima antes de tentar atualizá-los manualmente. Para informações sobre como atualizar manualmente na CMA veja Atualização Manual de CMA.

Para Contas grandes, atualizações manuais de CMA podem demorar muito tempo para serem concluídas. Em vez de atualizar manualmente cada Socket, pode ser necessário apenas solucionar problemas e atualizar o Socket que falhou (ação Falhada) durante a primeira janela de manutenção e então agendar uma nova janela de manutenção. Para informações sobre reagendar uma janela de manutenção na CMA veja Reagendamento do Processo de Atualização.

Se o processo de atualização continuar a falhar com o mesmo ou outros Sockets, envie um Ticket de Suporte com os resultados da solução de problemas acima.

 

Falha do Túnel ao Estabelecer após uma Atualização

Analisando Eventos CMA

Eventos de atualização do Socket com Ação Falhada e mensagem de evento Nenhum túnel aberto após tempo de graça indicam que o Socket foi reportado offline após o período de atualização do Socket ter terminado (17 minutos).

O pessoal local terá que estar no local e seguir os passos explicados em Resolvendo Socket Inacessível após uma Atualização.

 

Resolvendo Problemas Descobertos

Atualização Manual de CMA 

Uma falha de atualização pode ter sido causada por um problema de conectividade momentâneo e pode ser bem-sucedida na segunda tentativa. Para tentar uma nova atualização de Socket, inicie manualmente a atualização em Configurações do Site > Socket > Ações > Atualizar. Veja Atualizando Manualmente um Socket

É recomendado selecionar a versão de firmware mais recente disponível com o mecanismo de atualização sendo "Iniciado por Cato Cloud". 17 minutos após o início da atualização manual do firmware, a CMA exibirá uma notificação "atualizado com sucesso" indicando que o Socket relatou uma atualização bem-sucedida após o período de graça.

 

Resolvendo Socket Inacessível após uma Atualização

O pessoal local terá que seguir os seguintes passos:

Nota:  Sempre que possível, contatar Suporte da Cato para coletar arquivos de log do Socket via console antes de reiniciar o Socket. Esses logs são fundamentais para análise de causa raiz.

  1. Coletar Logs de Console. Conectar um cabo de console ao Socket. Vá para Gerenciador de Dispositivos > Portas e anote a porta COM do cabo de console. Abrir Putty ou um aplicativo de terminal similar e usar os parâmetros abaixo.

    Salve a saída do console em um arquivo de texto para investigação futura.
    • Em Sockets físicos, esta etapa deve ser feita antes de reiniciar o Socket, pois os logs do Socket são perdidos após o reboot.
    • Para vSockets no Azure, logs de console podem ser obtidos no Azure em VM > Ajuda > Diagnóstico de Boot > Log serial > Baixar log serial. Esses logs são coletados para até 6 boots.
  2. Reiniciar. O próximo passo é reiniciar se o túnel não for estabelecido ou se o Socket se tornar inacessível após uma atualização.
  3. Desatribuir e Reatribuir Socket para o local. Se a reinicialização não ajudar a ativar o túnel/Socket, desatribua o Socket no CMA. Se o Socket for detectado, ele aparecerá na notificação CMA após alguns minutos. Atribua o Socket de volta para o mesmo local.  
  4. Flash no Socket. Se não houver notificação CMA, o próximo passo é dar flash no Socket para seu estado padrão de fábrica. Você pode pressionar e segurar o botão F/D por 30-35 segundos ou realizar uma redefinição USB para fazer isso.
    • Para redefinição F/D, siga Redefinindo um Socket.
    • Se a redefinição F/D não funcionar por algum motivo, você pode realizar a Redefinição USB. Siga os artigos abaixo sobre como realizar a redefinição USB para os modelos de Socket respectivos:
      - X1500
      - X1500B
      - X1600
      - X1700
      - X1700B
  5. Contatar Suporte. Enviar os logs de console coletados para o Suporte e solicitar iniciar um processo de RMA para o Socket. Recomendamos iniciar este processo se todas as etapas acima foram realizadas e falharam.

Elevação de casos ao Suporte da Cato

Envie um ticket de suporte com os resultados das etapas de solução de problemas acima. Por favor, inclua as seguintes informações no ticket:

  • Detalhes dos Sockets afetados e impacto geral.
  • Eventos e Notificações CMA relacionados mostrando a falha na atualização do Socket.
  • Resultados das atualizações manuais e reprogramação da Janela de Manutenção.
  • Logs de console coletados se o Socket se tornar inacessível.

Esse artigo foi útil?

Usuários que acharam isso útil: 1 de 1

0 comentário