Vue d'ensemble
Des échecs de mise à niveau du Socket peuvent se produire à différentes étapes, depuis le déploiement initial jusqu'à la fenêtre de maintenance programmée, et les mises à niveau manuelles. Comprendre et résoudre ces problèmes rapidement est crucial pour maintenir l'intégrité du réseau. Voici un aperçu du processus de dépannage pour aborder les échecs de mise à niveau du Socket.
Symptômes
- Échec initial de la mise à niveau : survient pendant le déploiement du Socket.
- Problèmes de fenêtre de maintenance : Un grand nombre de Sockets n'ont pas été mis à niveau pendant la maintenance programmée.
- Tunnel établi après un échec de mise à niveau : La mise à niveau du Socket a échoué, mais le tunnel reste actif.
- Inaccessibilité après la mise à niveau : Les Sockets deviennent inaccessibles après une mise à niveau.
Causes possibles
- Problèmes de connectivité : Temps d'attente dépassé en raison d'un internet lent ou de réglages MTU incorrects.
- Échecs de résolution DNS : Incapacité à résoudre cc2.catonetworks.com.
- Restrictions du pare-feu : Pare-feux avec inspection SSL.
- Limitations de port : Restrictions WAN1/Port1.
Dépannage des échecs de mise à niveau du Socket
Remarque
Remarque : Avant de commencer le dépannage, assurez-vous de comprendre comment fonctionnent les mises à niveau du Socket chez Cato dans l'article suivant : Understanding Cato's Managed Socket Upgrade Service
Les mises à niveau du Socket auront lieu pendant la fenêtre de maintenance configurée dans CMA ou pendant le déploiement initial. Cette section explorera les étapes impliquées dans le dépannage des échecs de mise à niveau du Socket. Il y a principalement trois résultats possibles pour les échecs de mise à niveau :
- La mise à niveau initiale du Socket échoue pendant le déploiement du Socket.
- Le tunnel reste actif et établi malgré l'échec de la mise à niveau.
- Le tunnel ne parvient pas à s'établir et le Socket devient inaccessible après l'échec de la mise à niveau.
Échec de la mise à niveau initiale
Lorsqu'un Socket nouvellement déployé ou réinitialisé d'usine se connecte pour la première fois à Internet, il tentera continuellement de se connecter à Cato via son port WAN et tentera de mettre à niveau sa version de firmware.
Pour résoudre les échecs de mise à niveau initiale, veuillez consulter Dépannage des échecs de mise à niveau initiale du firmware
Le tunnel est établi après un échec de mise à niveau
Pendant une fenêtre de maintenance, le processus de mise à niveau du Socket peut ne pas réussir, entraînant un échec de mise à niveau qui empêche d'autres Sockets de tout le compte d'être mis à niveau. Il est important d'identifier les mises à niveau échouées et de se concentrer sur leur mise à niveau avant de programmer une nouvelle fenêtre de maintenance.
Analyse des événements CMA
Passez en revue les événements liés à la mise à niveau du Socket en filtrant le Sous-type par Mise à niveau du Socket et l'Action par Non réussie
Les événements avec l'action Omis peuvent indiquer que le Socket était hors ligne pendant la fenêtre de maintenance ou qu'un autre Socket n'a pas pu être mis à niveau (Pas de tunnel ouvert après temps de grâce), ce qui a conduit à l'omission de tous les Sockets restants. La raison de l'action d'omission peut être vue dans le Message de l'événement. Par exemple :
- La mise à niveau a été omise. Le socket principal était hors ligne pendant la fenêtre de maintenance.
- La mise à niveau a été omise. Mise à niveau en attente omise pour ce Socket, car un Socket différent n'a pas pu terminer la mise à niveau.
Les événements avec l'action Échoué indiquent que la mise à niveau du Socket a été tentée mais que le processus de mise à niveau lui-même a échoué. La raison de l'action échouée peut être vue dans le Message de l'événement
Si le Socket devient inaccessible après cet échec, allez sur Le tunnel ne parvient pas à s'établir après une mise à niveau.
Continuez le processus de dépannage en vous concentrant sur les Sockets avec l'action Échoué.
Dépannage des échecs pendant la mise à niveau
Pendant le processus de mise à niveau, le Socket tentera de télécharger l'image du firmware. Des délais peuvent se produire pour les raisons suivantes :
- Échec de résolution DNS correcte pour cc2.catonetworks.com
- Une connexion Internet lente ou peu fiable empêche le téléchargement du firmware.
- Paramétrage incorrect de MTU sur les interfaces WAN.
Pour écarter les raisons ci-dessus, vérifiez les éléments suivants :
- Utilisez l'outil Ping depuis le WebUI pour confirmer que le Socket peut résoudre cc2.catonetworks.com via le tunnel. Si le FQDN n'est pas résolu, vérifiez les paramètres DNS sur le port WAN.
- Dans Network Analytics, vérifiez si le tunnel a présenté une perte de paquets pendant la fenêtre de maintenance. Si oui, vérifiez s'il y a également perte de paquets au dernier kilomètre et signalez ce problème à l'ISP.
- Les Sockets Cato exécutent PMTUD (découverte de MTU) avec le PoP pour déterminer le MTU autorisé sur le tunnel. Cependant, définir manuellement le MTU sur l'interface WAN peut entraîner une fragmentation des paquets et une dégradation des performances. Vérifiez la valeur MTU configurée dans le WebUI.
Dépannage des échecs après la mise à niveau
Une fois le firmware téléchargé et installé sur le Socket, le Socket entrera dans une période de grâce (10 minutes) où plusieurs vérifications sont effectuées pour déterminer que la nouvelle version installée est stable :
- Le processus de socket est en cours d'exécution.
- Le ping fonctionne vers cc2.catonetworks.com, 8.8.8.8, et Facebook via Internet
- La connexion au PoP est établie pendant au moins 5 minutes.
- Il y a eu au moins dix synchronisations réussies entre le Socket et le PoP.
- cURL fonctionne vers cc2.catonetworks.com via le tunnel.
Si les vérifications ne réussissent pas pendant la période de grâce, le Socket reviendra à la version précédente, supposant que la nouvelle version est instable. Assurez-vous que le Socket conserve son accès Internet pendant 10 minutes après la fin de la mise à niveau.
Effectuer un redémarrage du Socket
Dans certains échecs de mise à niveau Fatals, redémarrer le Socket peut être utile avant de réessayer la mise à niveau du firmware. Si le tunnel est encore actif après l'échec de la mise à niveau, un redémarrage à distance du Socket peut être effectué via le WebUI sous l'onglet Administration.
Si le Socket est inaccessible après l'échec de la mise à niveau, allez sur Le tunnel ne parvient pas à s'établir après une mise à niveau.
Mise à niveau manuelle du Socket et reprogrammation
Les Sockets avec l'action Omis pendant la fenêtre de maintenance peuvent être mis à niveau manuellement depuis le CMA une fois que le Socket est à nouveau en ligne. Les Sockets avec l'action Échouée doivent suivre les étapes de dépannage ci-dessus avant de tenter de les mettre à niveau manuellement. Pour obtenir des informations sur la mise à niveau manuelle dans CMA, consultez Mise à niveau manuelle de CMA.
Pour les grands comptes, les mises à niveau manuelles de CMA peuvent prendre beaucoup de temps à se terminer. Au lieu de mettre à niveau manuellement chaque Socket, il peut être nécessaire de dépanner et de mettre à niveau uniquement le Socket qui a échoué (action Échoué) lors de la première fenêtre de maintenance, puis de programmer une nouvelle fenêtre de maintenance. Pour obtenir des informations sur la reprogrammation d'une fenêtre de maintenance dans le CMA, consultez Reprogrammation du processus de mise à niveau.
Si le processus de mise à niveau continue d'échouer avec le même ou d'autres Sockets, soumettez un ticket de support avec les résultats du dépannage ci-dessus.
Le tunnel ne parvient pas à s'établir après une mise à niveau
Analyse des événements CMA
Les événements de mise à niveau du Socket avec l'action Échoué et le message d'événement Pas de tunnel ouvert après temps de grâce indiquent que le Socket a été signalé hors ligne après la fin de la période de mise à niveau du Socket (17 minutes).
Le personnel sur site devra être présent et suivre les étapes expliquées dans Résolution d'un Socket inaccessible après une mise à niveau.
Résolution des problèmes découverts
Mise à niveau manuelle de CMA
Un échec de mise à niveau peut avoir été causé par un problème de connectivité momentané et pourrait réussir au deuxième essai. Pour tenter une nouvelle mise à niveau de Socket, initiez manuellement la mise à niveau depuis Configuration du Site > Socket > Actions > Mettre à niveau. Voir Mise à niveau manuelle d'un Socket
Il est recommandé de sélectionner la dernière version de firmware disponible avec le mécanisme de mise à niveau "Initiée par Cato Cloud". 17 minutes après le début de la mise à niveau manuelle du firmware, le CMA affichera une notification "mise à niveau réussie" indiquant que le Socket a signalé une mise à niveau réussie après la période de grâce.
Replanification du processus de mise à niveau
Une fois que le Socket précédemment échoué a été mis à niveau manuellement ou avec l'aide du Support, il est possible de planifier une nouvelle fenêtre de maintenance pour mettre à niveau les Sockets restants en changeant la date/heure de la fenêtre de maintenance du Socket dans le CMA. Voir Configuration de la fenêtre de maintenance de mise à niveau du Socket
Cette action déclenchera une notification CMA "Mise à niveau de version de Sockets disponible" avec le nombre de Sockets qui seront mis à niveau dans la nouvelle fenêtre de maintenance. Assurez-vous de programmer la nouvelle fenêtre de maintenance au moins 48 heures après le moment où vous la programmez. S'il y a moins de 48 heures avant la fenêtre de maintenance du site, le site attend la semaine suivante pour initier la mise à niveau du Socket.
Résolution d'un Socket inaccessible après une mise à niveau
Le personnel sur site devra suivre les étapes suivantes :
Note : Chaque fois que possible, contacter le Support Cato pour collecter les fichiers log Socket via la console avant de redémarrer le Socket. Ces journaux sont cruciaux pour l'analyse des causes profondes.
-
Collecter les journaux de console. Connectez un câble de console au Socket. Allez dans Gestionnaire de périphériques > Ports et notez le port COM du câble de console. Ouvrir Putty ou une application terminale similaire et utiliser les paramètres ci-dessous.
Enregistrez la sortie de la console dans un fichier texte pour une enquête future.
- Sur les Sockets physiques, cette étape doit être effectuée avant de redémarrer le Socket car les journaux du Socket sont perdus après le redémarrage.
- Pour les vSockets Azure, les journaux de console peuvent être obtenus depuis Azure sous le VM > Aide > Diagnostics de démarrage > Journal série > Télécharger le journal série. Ces journaux sont collectés pour jusqu'à 6 démarrages.
- Redémarrer. L'étape suivante est de redémarrer si le tunnel ne parvient pas à se créer ou si le Socket devient inaccessible après une mise à niveau.
- Désassigner et réassigner le Socket au Site. Si le redémarrage ne permet pas de relancer le tunnel/Socket, désassignez le Socket dans CMA. Si le Socket est détecté, il apparaîtra dans la notification CMA après quelques minutes. Réassignez le Socket au même Site.
-
Flasher le Socket. S'il n'y a pas de notification CMA, l'étape suivante est de flasher le Socket à son état par défaut d'usine. Vous pouvez soit appuyer et maintenir le bouton F/D pendant 30-35 secondes, soit effectuer une réinitialisation USB pour cela.
- Pour la réinitialisation F/D, suivez Réinitialisation d'un Socket.
- Si la réinitialisation F/D n'a pas fonctionné pour une raison quelconque, vous pouvez effectuer la réinitialisation USB. Suivez les articles ci-dessous sur la façon d'effectuer la réinitialisation USB pour les modèles de Socket respectifs:
- X1500
- X1500B
- X1600
- X1700
- X1700B
- Contactez le support. Soumettez les journaux de console collectés au support et demandez à initier un processus de RMA pour le Socket. Nous recommandons d'initier ce processus si toutes les étapes ci-dessus ont été effectuées et ont échoué.
Élévation des cas au Support de Cato
Soumettez un ticket de support avec les résultats des étapes de dépannage ci-dessus. Veuillez inclure les informations suivantes dans le ticket :
- Détails des Sockets affectés et impact global.
- Événements CMA et notifications liés montrant l'échec de la mise à niveau du Socket.
- Résultats des mises à niveau manuelles et replanification de la fenêtre de maintenance.
- Journaux de console collectés si le Socket devient inaccessible.
0 commentaire
Vous devez vous connecter pour laisser un commentaire.