Monitoreo


Las alertas de monitoreo son la función más importante del CIOS. No importa que alertas son, de donde vienen, como se generen o funcionen. Lo que es más importante para el personal de monitoreo y para el negocio al que le dan soporte, es que tratamiento se le da a las alertas cuando son recibidas.

Una locación que no lleva a cabo monitoreo pero que sí desempeña acciones correctivas únicamente cuando el usuario llama con un problema, es un centro de atención de llamadas (call center) o un servicio de asistencia técnica (help-desk). No es un CIOS.

Una alerta es una simple notificación de que ha ocurrido un incidente. Un incidente es algo que pasa fuera de lo común que puede ocasionar una interrupción en el servicio a los clientes. Usualmente, una alarma es una advertencia de que si un incidente, algo fuera de lo ordinario, no se revisa, puede provocar un fallo de una aplicación o de alguna pieza de hardware (computadora, servidor, red o aparato de almacenamiento) o puede afectar la integridad de tus datos o de tu sistema.

En un ambiente correctamente monitoreado, nada fuera de lo común o fuera de ciertos umbrales debe activar una alerta. El tipo de evento y que tan importante o urgente es, determina el tipo de alerta, a donde es enviada y si algo debe suceder automáticamente.

El CIOS debe tener un equipo cuya función principal sea monitorear. En un entorno de misión crítica, la peor reacción es reducir el tamaño del personal de monitoreo debido a que no haya habido problemas.

No hay problemas debido a que el equipo de monitoreo ha estado realizando su trabajo.

Esto quiere decir que han estado evitando que los problemas ocurran. Si el equipo de monitoreo está constantemente ocupado, entonces tú tienes un problema serio. Esto quiere decir que las alertas no están configuradas correctamente o que tus aplicaciones y sistemas computacionales son muy inestables; en cualquiera de los dos casos, tus clientes no van a estar muy felices.



El monitoreo no solo es responsabilidad del equipo que está viendo las pantallas, sino de todos, más allá de sus funciones. Asegurarse de que todos sepan que esta es una responsabilidad compartida, garantiza que el objetivo principal del centro de control – un entorno de operación seguro y normal – esté en la mente de todos. Lo que pasa después de que una alerta es detectada por el personal del centro de control depende de quién desempeñe las otras funciones críticas/de emergencia mencionadas arriba.

Todas las funciones deben considerar al menos los siguientes niveles de Monitoreo: Negocio, servicios, aplicación e infraestructura.


9 Dominios del monitoreo

Bajo el contexto del monitoreo de infraestructura de tecnologías de información (TI), los requerimientos han evolucionado al paso del tiempo. Desde hace 20 años las necesidades de monitoreo se han vuelto más complejas, disponibilidad de los componentes, tiempos de respuesta del envío y recepción de paquetes de datos, estado de las transacciones de datos, utilización de los recursos de la infraestructura y/o servicios, desempeño de las aplicaciones, tiempos de respuesta de las aplicaciones web, desempeño de los servicios y/o aplicaciones en la nube y experiencia de usuario.

A lo largo de este tiempo, integrando soluciones de monitoreo, he podido identificar 9 dominio o demonios, los cuales se representan en la siguiente imagen.


imagen_66ec620583f24.jpg


Estos dominios/demonios se han creado derivado del modelo tradicional de operar en silos y de manera vertical enfocado en el componente tecnológico.

En su momento tuvieron su razón de ser, cuando los servicios se definían por torre de control y el objetivo era ese, controlar. Ahora el modelo ha cambiado y debemos colaborar, ser efectivos al igual que ágiles en el proceso de ser proactivos y en la medida de lo posible predictivos.

Ante la complejidad de interconexión y dependencias que requiere la automatización de proceso y/o servicios así como la demanda de un monitoreo más sofisticado y complejo en su análisis, se requiere un nuevo enfoque de abordaje para dar respuesta a estas demandas.

La propuesta es integrar los dominios en un solo dominio mayor alineado al servicio y/o procesos de manera integral.


imagen_66ec62058435e.jpg


Con este enfoque se vinculan las interfaces y dependencias significativas de un proceso o servicio, eliminando las barreras de visibilidad del impacto de una desviación de infraestructura, ya sea por disponibilidad, capacidad, desempeño y/o experiencia de usuario.

Este enfoque requiere una capacidad diferente en las herramientas a poder vincular la tecnología, los procesos y los equipos de manera simultánea para detectar, analizar, tomar acción, mitigar y remediar las desviaciones se puedan presentar en cualquier componente tecnológico que soporte la cadena de servicio y/o proceso de negocio.