Este playbook describe los pasos para resolver problemas cuando el Monitoreo LAN está configurado y el Cato Cloud no puede alcanzar un host detrás de un sitio.
La función de Monitoreo LAN le permite definir hosts detrás de un sitio mediante su dirección IP, y el Umbral de fallos para el host (el número máximo de pruebas ICMP consecutivas fallidas). Un PoP en el Cato Cloud envía pruebas ICMP al host, si el host no responde al número especificado de pruebas ICMP, se considera caído y se genera automáticamente un evento. También puede optar por enviar una notificación por correo electrónico cuando un host es inalcanzable.
Cuando se restaura la conectividad entre el host y el PoP, se genera un nuevo evento indicando que el host es alcanzable.
Para más información, consulte Trabajando con Monitoreo LAN para un Sitio.
Las siguientes son las diferentes maneras en que un administrador de la Aplicación de Gestión Cato puede verificar que un host monitorizado se haya vuelto inalcanzable para el PoP de monitoreo:
-
Vaya a la página del Banco de Trabajo de Historias y use el preajuste Network XDR para encontrar las historias de host de monitoreo LAN inalcanzable.
La historia proporciona información sobre el estado actual del sitio, una línea de tiempo del incidente y más.
-
Evento de Monitoreo LAN con la acción Host Inalcanzable
-
Use el filtro preajustado hosts LAN inalcanzables y ajuste el marco de tiempo si es necesario
-
-
Notificación de correo electrónico de Monitoreo LAN
-
Cuando las notificaciones por correo electrónico están habilitadas para una regla de Monitoreo LAN, se envían correos electrónicos a la lista de correo (puede incluir a no administradores).
-
Al responder a historias de Operaciones del Sitio, es importante abordar el problema primero verificando que el problema continúe, luego solucionando el problema y finalmente verificando que el problema esté resuelto.
Esta sección discute diferentes herramientas de Cato que puede usar para verificar la razón por la cual el host es inalcanzable.
Usando Preajustes de Eventos de Monitoreo LAN
Usar el filtro de Eventos preajustados de Monitoreo LAN nos permite verificar el último evento relacionado con el host en cuestión. Si este evento no es seguido por un evento que indique que la conectividad ha regresado, esto sugiere que el host aún es inalcanzable.
Visualización de la Historia para el Estado Actual
La Historia en sí misma también puede usarse para determinar la continuidad de la inalcanzabilidad de un host. El estado actual de la historia se muestra en el Tablero. Un estado de historia Abierto muestra que este evento aún está en curso.
Paso 2 - Resolviendo Problemas de Conectividad del Host
Esta sección discute herramientas dentro de Cato que pueden usarse para seguir un enfoque estructurado de resolución de problemas para este tipo de incidente. Estos pasos deben seguirse generalmente en orden, pero los resultados de estas verificaciones pueden determinar cuál podría ser el siguiente paso.
Revise los cambios en la página del Rastro de Auditoría para la Aplicación de Gestión Cato, y vea si hay una configuración relacionada con este problema. Si alguna configuración condujo directamente al cambio en el estado del host, considere revertir el cambio.
Hosts Conocidos
La página de Hosts Conocidos en el CMA (Red > Sitios > {nombre del sitio} > Monitoreo del Sitio > Hosts Conocidos) puede usarse para recopilar información sobre puntos finales individuales vistos dentro de un sitio. Esta información incluye cuánto tiempo hace que se vieron los últimos paquetes que provenían de ese host.
Típicamente, un host monitorizado que responde a paquetes ICMP como parte del Monitoreo LAN siempre estará actualizando este temporizador. Un ejemplo como el anterior sugiere el tiempo en que se perdió la capacidad de alcanzar al host. Esto puede proporcionar contexto adicional. Por ejemplo, ¿esta ventana de tiempo coincide con alguna ventana de mantenimiento esperada o eventos de energía que puedan haber afectado la conectividad del host, o cambios de red en el entorno local?
Puede usar el WebUI de Socket para hacer ping al host desde la interfaz LAN. Para más información, consulte Usando las Herramientas WebUI de Socket.
-
Desde el WebUI de Socket, haga ping al host con estos ajustes:
-
Ruta vía - LAN
-
Nombre del host/IP - Dirección IP del host inalcanzable
Si no hay respuesta al ping, el problema podría estar relacionado con el ruteo, o el host podría estar generalmente inalcanzable, apagado o no configurado para responder a pings, por ejemplo.
-
-
-
Usando las herramientas de WebUI de Socket, tome un PCAP de la interfaz LAN mientras una petición de ping al host en cuestión está en curso. Vea si hay un ping bidireccional entre el socket y el host.
El ejemplo anterior muestra que no hay respuesta del socket cuando se envía un ARP para la dirección física del host en cuestión. Esto implica que el host está en la misma red local que la LAN del socket, pero que el host no está respondiendo a nivel 2. Para este resultado, verifique que el host esté encendido y listo para responder a solicitudes ARP.
El ejemplo anterior muestra tanto el socket como las solicitudes ICMP de Monitoreo LAN configuradas originalmente por el PoP al host monitorizado. Nota la dirección de origen 10.254.254.1 y el delta de tiempo (10 segundos) entre las solicitudes de monitoreo ICMP LAN enviadas por el PoP. El hecho de que se envíe la solicitud ICMP muestra que se está utilizando la dirección MAC de ya sea el siguiente salto o el host final para enviar estas solicitudes. Verifique si esta dirección MAC sugiere que el host monitorizado existe detrás de un límite de capa 3, o es local a la red LAN del socket.
- Si el host monitorizado está detrás de un límite de capa 3, comience a investigar cómo se manejan las solicitudes ICMP en ese salto. Si la respuesta ICMP del host está alcanzando ese dispositivo de límite de capa 3, es probablemente un problema de ruteo en ese límite de capa 3.
- Si el host monitorizado está dentro de la red LAN del socket, es probable que el dispositivo esté apagado o de otra manera no configurado o capaz de responder a ICMP.
-
Después de solucionar el problema con el host, verifique que sea alcanzable y tenga conectividad con el Cato Cloud.
Desde la página de Hosts Conocidos, muestre el host y verifique que la Última Actividad del Host esté mostrando datos para el tiempo actual.
Use el WebUI de Socket para hacer ping al host, usando la interfaz LAN para verificar que el host tenga conectividad con el sitio.
Después de que se restaura la conectividad entre el host y el Cato Cloud, se genera un evento de Host Alcanzable. Puede configurar manualmente el filtro de eventos para que la Acción SEA Host Alcanzable para mostrar el evento.
Elevando Casos con el Soporte de Cato
Si después de seguir este playbook no puede rectificar el problema, puede que quiera generar un ticket con el Soporte de Cato. Al hacer esto, para la resolución más rápida, es importante que incluya toda la información reunida al seguir los pasos anteriores.
Por favor vea Enviando un Ticket de Soporte
0 comentarios
Inicie sesión para dejar un comentario.