Este artículo trata sobre cómo puedes usar el Banco de Trabajo de Historias para revisar historias de Operaciones del Sitio relacionadas con problemas de conectividad y rendimiento en tu red.
Cato XOps identifica problemas de red como la degradación, además de potenciales amenazas de seguridad. El motor avanzado de Operaciones del Sitio detecta diferentes indicaciones y métricas relacionadas con conectividad y rendimiento, y genera historias que correlacionan los datos para problemas relacionados con la red. Por ejemplo, si un enlace WAN está experimentando intermitentemente una alta pérdida de paquetes, el motor creará una sola historia con todos los datos relevantes para el enlace.
La página del Banco de Trabajo de Historias muestra los detalles de cada historia para ayudarte a entender y analizar los problemas. Puedes ordenar y filtrar las historias para encontrar los incidentes más importantes, y luego profundizar en una historia para investigar más los detalles y resolver el problema.
Estas son las indicaciones de problemas de conectividad y rendimiento de red que son detectadas por el motor de Operaciones del Sitio para generar historias:
|
Indicación |
Descripción |
Umbral para Generar una Historia |
|---|---|---|
|
Sitio caído |
El sitio se desconectó del Cato Cloud. |
Todos los enlaces están caídos durante 2.5 minutos |
|
Enlace caído |
Uno de los enlaces WAN para un sitio se desconectó del Cato Cloud, el sitio todavía está conectado. |
Un enlace está caído durante 5 minutos, o un enlace tuvo 5 desconexiones más cortas en un periodo de 10 minutos |
|
Sesión BGP desconectada |
Una sesión BGP se desconectó inesperadamente, lo que puede impactar la conectividad de la aplicación y la experiencia del usuario. |
Una sesión BGP está caída por 5 minutos o tuvo 5 o más desconexiones más cortas en un periodo de 10 minutos |
|
Monitoreo LAN - anfitrión inalcanzable |
Un anfitrión monitoreado detrás de un sitio no está respondiendo a los paquetes de mantenimiento desde el PoP y se considera inalcanzable. Requiere una regla de Monitoreo LAN configurada para el anfitrión. |
Un evento de Monitoreo LAN Inalcanzable |
|
Calidad del enlace SLA |
El umbral de calidad SLA del enlace para un sitio ha sido superado. Esto puede impactar la experiencia del usuario. Los umbrales SLA están configurados para Reglas de Calidad de Salud. Notas:
|
Un evento de Regla de Calidad de Salud |
|
Estado de No Listo de HA del Socket |
Hay un problema con la configuración de Alta Disponibilidad (HA) del Socket, y el estado es No Listo. |
Si ocurre una de las siguientes condiciones de Estado de No Listo de HA del Socket:
Para más información sobre estas condiciones, consulte ¿Qué es Socket HA? |
|
Reconexión de PoP para mejorar la conectividad |
El sitio fue forzado a reconectarse al PoP para optimizar el rendimiento. Reconectar al PoP puede impactar la experiencia del usuario. |
Un evento de reconexión con este mensaje: Problema de rendimiento detectado, reconectado a un nodo de servicio diferente en el Cato Cloud Para más información sobre los campos del mensaje de eventos, consulte Entendiendo los Campos del Mensaje de Evento de Conectividad de Socket |
|
Puerto LAN caído |
Uno de los puertos LAN se desconectó |
El puerto está caído durante 5 minutos |
|
Enlace WAN alternativo caído |
Uno de los Alt. Enlaces WAN desconectados |
El enlace está caído o el número de canales se redujo a 0 por 5 minutos |
|
Socket desconectado después de la actualización |
Un socket no reestableció un túnel dentro del tiempo esperado después de actualizar a una nueva versión. |
Socket está desconectado por 5 minutos después de la finalización del tiempo de actualización esperado |
Las historias de Operaciones del Sitio pasan por diferentes etapas a lo largo del ciclo de vida de la historia, desde el problema inicial que activó la historia, hasta la resolución final. Sin embargo, los ciclos de vida de las historias son ligeramente diferentes para las historias de Sitio caído frente a otros tipos de historias. Esto se debe a que cuando una historia de Sitio caído está en curso, no se crean otras historias para el sitio para evitar la creación de historias redundantes.
Por ejemplo, si un sitio con dos enlaces WAN cae, se genera una única historia de Sitio caído sin historias separadas de Enlace caído para cada enlace WAN.
A continuación se presentan las etapas potenciales para una historia de Sitio caído y otros tipos de historias:
-
Etapas en el ciclo de vida de la historia de Sitio caído:
-
Abierto - el problema está actualmente en progreso, y la historia está creada
-
Monitoreo - El problema ha sido resuelto por menos de 2 horas
-
Cerrado - El problema ha sido resuelto por 2 horas, y la historia está cerrada
-
-
Etapas en el ciclo de vida de otros tipos de historias:
-
En espera - El problema está en progreso, pero no se crea ninguna historia porque el sitio está actualmente caído. El problema permanece en espera hasta que hayan pasado 2 minutos después de que la historia de Sitio caído esté cerrada
-
Abierto - el problema está actualmente en progreso, y la historia está creada
-
Monitoreo - El problema ha sido resuelto por menos de 2 horas
-
Cerrado - El problema ha sido resuelto por 2 horas, y la historia está cerrada
-
Nota
Nota: las historias de Operaciones del Sitio también se cierran automáticamente en los siguientes casos:
-
30 días de antigüedad: Cerrado para asegurar un seguimiento fresco si el problema recurre
-
La historia requiere revalidación: El motor de Operaciones del Sitio determinó que la historia necesita ser revalidada. El motor valida y reabre la historia si el problema recurre
-
Cambio de configuración: Una entidad en la historia (enlace, sitio, rango BGP, anfitrión) ya no es relevante debido a actualizaciones de configuración
Este es un ejemplo de caso de uso para un administrador que identifica y resuelve una historia de red de Operaciones del Sitio con el Banco de Trabajo de Historias:
-
Filtró el Banco de Trabajo de Historias para mostrar historias abiertas de Operaciones del Sitio agrupadas por sitio
-
Identificó una historia de alta criticidad para el sitio de Nueva York, con la indicación Enlace caído
-
Abrió la página de detalles de la historia, revisó los datos de la historia y descubrió que el enlace WAN 01 del sitio estaba desconectado del Cato Cloud
-
Revisó el libro de jugadas relevante para investigar y solucionar el problema
-
Después de revisar el Socket físico en el sitio de Nueva York, descubrió que el cable del enlace WAN 01 estaba defectuoso
-
Reemplazó el cable, confirmó que el enlace estaba activo y conectado, y continuó monitoreando la historia para posible recurrencia del problema
-
Historia cerrada automáticamente después de dos horas sin recurrencia
La página del Banco de Trabajo de Historias muestra un resumen de las historias de XOps para su cuenta.
Para ver la página del Banco de Trabajo de Historias:
-
Desde el menú de navegación, haz clic en Home > Banco de Trabajo de Historias.
|
Columna |
Descripción |
|---|---|
|
ID |
ID único de Cato para esta historia |
|
Estado |
Los estados para una historia de Operaciones del Sitio representan diferentes etapas a lo largo del ciclo de vida de la historia, desde el problema inicial que activó la historia, hasta la resolución final. El motor de Operaciones del Sitio actualiza automáticamente el estado cuando detecta los cambios relevantes en el incidente de red. Estos son los tipos de estado:
|
|
Creado |
Fecha de la primera flujo de tráfico para la historia |
|
Actualizado |
Fecha del flujo de tráfico más reciente para la historia |
|
Gravedad |
|
|
Indicación |
|
|
Fuente |
|
|
Ocurrencias |
El número de veces que ocurrió el problema, incluyendo recurrencias después de una resolución temporal. Por ejemplo, si un enlace se desconecta y reconecta repetidamente, cada desconexión cuenta como una ocurrencia |
|
Tipo de motor |
El motor que creó la historia. Para historias de Operaciones del Sitio, el motor es Operaciones del Sitio |
Para proporcionar contexto al revisar las historias, puedes mostrar las historias en grupos definidos por detalles que incluyen Fuentes, Indicación, Estado, y Tipo. Por ejemplo, puedes mostrar juntas todas las historias relacionadas con un sitio de fuente específico, o todas las historias de Calidad de Enlace SLA. Esto te da una perspectiva más amplia al analizar las historias y puede ayudarte a entender y resolver problemas más rápidamente.
Para historias de Operaciones del Sitio, las Fuentes son sitios en tu red.
Recomendamos como mejor práctica comenzar tu análisis de historias de Red agrupando por Fuentes.
Cada grupo resalta los niveles de criticidad para las historias en ese grupo, incluyendo el número de historias de alta, media y baja gravedad.
Hay tres maneras de filtrar los datos en el Banco de Trabajo de Historias:
-
Selecciona un filtro preestablecido
-
Actualiza automáticamente el filtro con un elemento seleccionado
-
Configura manualmente el filtro
Puedes seleccionar un filtro preestablecido para centrarte en historias de Operaciones de Red o Operaciones de Seguridad. Al seleccionar un filtro preestablecido, las columnas de historia más relevantes para ese tipo de historia se muestran por defecto.
Cuando pase el ratón sobre un artículo o campo donde está disponible una opción de filtro, aparece el botón . Haz clic en el icono para mostrar las opciones de filtro:
-
Agregar al Filtro - Agrega el elemento al filtro, y el Banco de Trabajo de Historias ahora solo muestra historias que incluyen este elemento. Por ejemplo, si filtras por un puntaje de Criticidad específico, la página solo muestra historias con esa Criticidad.
-
Excluir del Filtro - Actualiza el filtro para excluir este elemento, y el Banco de Trabajo de Historias ahora solo muestra historias que NO incluyen este elemento.
Puede continuar agregando elementos al filtro, haga clic en nuevamente para actualizar el filtro y profundizar más.
El rango de tiempo predeterminado para el Banco de Trabajo de Historias son los dos días anteriores. Puedes seleccionar un rango de tiempo diferente para mostrar un período de tiempo más largo o más corto. Para más información, consulte Estableciendo el filtro de rango de tiempo.
El rango máximo de fechas para el Banco de Trabajo de Historias es de 90 días.
Puedes configurar manualmente el filtro de historias para mayor granularidad al analizar las historias. Después de configurar el filtro, se agrega a la barra de filtros de historias y la página se actualiza automáticamente para mostrar las historias que coinciden con el nuevo filtro.
Para crear un filtro:
-
En la barra de filtro, haga clic en
.
-
Empieza a escribir o selecciona el Campo.
-
Selecciona el Operador, que determina la relación entre el Campo y el Valor que estás buscando.
-
Selecciona el Valor.
-
Haz clic en Agregar Filtro. El filtro se agrega a la barra de filtros y el Banco de Trabajo de Historias se actualiza para mostrar historias basadas en los filtros.
Puedes eliminar cada elemento del filtro por separado o limpiar todo el filtro.
Puedes hacer clic en una historia en el Banco de Trabajo de Historias para profundizar e investigar los detalles en una página diferente. Esta página contiene varios widgets que te ayudan a evaluar el posible problema identificado por el motor de Operaciones del Sitio.
El desglose del Banco de Trabajo de Historias incluye un enlace a un playbook que ofrece pasos para investigar, resolver problemas y resolver el problema. Cada historia de Operaciones del Sitio se vincula a un playbook para la indicación específica de la historia. Por ejemplo, un playbook para historias con la indicación Estado de Socket HA No Listo.
El desglose del Banco de Trabajo de Historias incluye una herramienta que te permite crear una descripción de historia en lenguaje natural generada por IA, que proporciona un contexto rico y te ayuda a evaluar rápidamente la historia. El resumen de la historia se genera dinámicamente para reflejar el estado actual de la historia. Si la historia se actualiza con nueva información, puedes regenerar el resumen para reflejar los cambios.
Para más información sobre la generación de resúmenes de historias por IA, consulte abajo.
-
El resumen de la historia por IA solo se genera bajo demanda por el administrador
Para una seguridad robusta de datos durante la transmisión de datos de historias a servicios de IA de terceros, Cato utiliza la tokenización para garantizar que todos los datos sensibles permanezcan en la plataforma XOps de Cato. Esto implica reemplazar la información sensible con identificadores únicos, o "tokens", haciendo que los datos sean inútiles para entidades no autorizadas. Los datos sensibles nunca se exponen a servicios de terceros. Este enfoque asegura la confidencialidad de los detalles de la historia, alineándose con nuestro compromiso con estándares robustos de privacidad y seguridad de datos.
Nota
Nota: Debido a las limitaciones de la IA generativa, la información proporcionada en los resúmenes de historias puede ocasionalmente contener inexactitudes.
Estos son los widgets de desglose de historias:
|
Artículo |
Nombre |
Descripción |
|---|---|---|
|
1 |
Resumen de la historia |
Un resumen de la información básica sobre la historia, incluyendo:
|
|
2 |
Muestra una cronología de cambios en el estado de la historia |
|
|
3 |
Detalles de la historia |
Información básica para analizar la historia, incluyendo una descripción de la misma, cuándo fue creada y actualizada con nuevos incidentes de red relacionados, y la información sobre el sitio. |
|
4 |
Resumen del Sitio Actual |
Información sobre el sitio de su red afectado por la historia. El widget incluye un enlace para ver registros recientes de conexiones del sitio y menús desplegables con accesos directos a las páginas de Configuración del Sitio y Monitoreo del Sitio. Este widget es el mismo que el Panel de Información del Sitio en la página de Topología. |
|
5 |
Línea de Tiempo de Incidentes |
Una lista de los incidentes detectados para problemas y resoluciones en la historia. Por ejemplo, la Línea de Tiempo de Incidentes para una historia de Link is down incluye estos incidentes:
Estas son las columnas para la Línea de Tiempo de Incidentes:
|
La Política de Respuesta de XOps le ayuda a monitorear historias de XOps definiendo cuándo se envían notificaciones por correo electrónico de historias a los administradores. Puede crear reglas que definan los criterios de la historia para cuándo se envían notificaciones, y puede utilizar listas de correo para configurar qué administradores reciben las notificaciones. Por ejemplo, puede crear una regla para enviar notificaciones para una historia de Operaciones del Sitio con alta Gravedad, y definir la lista de correo para incluir una dirección de correo de la mesa de ayuda para abrir automáticamente un ticket de soporte.
Para más información sobre cómo crear reglas de la Política de Respuesta, consulte Creando la Política de Respuesta para Historias de XOps
0 comentarios
Inicie sesión para dejar un comentario.