Mesa de servicios (de TI)


LAS MEJORES PRÁCTICAS Y LOS ESTANDARES

ITIL

Catalogada como la mejor práctica (o al menos la más conocida) para la gestión de servicios de TI, ITIL por sus siglas en inglés de “Biblioteca de Infraestructura de Tecnologías de Información” la mayoría de las empresas que han formalizado sus procesos de gestión se han alineado a ella.

Por otro lado, existe el enfoque normativo, la ISO20000:20xx (de acuerdo a su versión), esta es una norma la cual es certificable y es empleada por las empresas que tienen un sistema de gestión integral que cubre los diferentes aspectos dentro de la organización (Seguridad, Calidad, Servicios, etc).

Ambos enfoques definen el centro de los procesos en una función denominada “Mesa de Servicio”.

La mesa de servicios es el punto neural de la gestión de los servicios normalizados por el estándar o por la mejor práctica.

Una frase acuñada con base en mi experiencia para definir la mesa de servicio es:

“Punto único de contacto a donde debe llamar un usuario de servicios de negocio basados en tecnología”

En esta frase aparecen 3 palabras cuyo espíritu es distinguir la principal diferencia entre una mesa de ayuda y una mesa de servicios de TI, “basados en tecnología”.

En el contexto del CIOS la mesa de servicios se convierte en el punto único de contacto de atención y supervisión de eventos e incidentes.

Supervisión de incidentes es uno de los términos dados al proceso de resolver problemas inmediatamente después de que se presentan, para evitar o reducir el impacto causado por el incidente. Es el proceso de coordinar la recuperación de un fallo en donde el impacto al negocio está en proceso o es inminente si no se resuelve rápidamente. Incluye asegurar la creación de un ticket de problema, lanzar todas las acciones que son parte de los esfuerzos de recuperación, involucrar a los equipos correspondientes y notificar a la gerencia en los intervalos preestablecidos.

Todas estas acciones se deben hacer de forma expedita, dando prioridad a los tiempos y niveles de servicio establecidos.

Cuando el equipo de monitoreo recibe una alerta de una anomalía que afecta la operación correcta de una función o una aplicación, esta es entregada al equipo de supervisión de incidentes. Este tipo de problemas es calificado como incidentes.

Un incidente es algo que ocurre y que afecta la normalidad, por ejemplo, una falla en el suministro de luz en un centro de datos, una computadora o aplicación que se descompone, o una falla en el hardware que afecte la operación correcta de cualquier cosa que usen tus usuarios. Si el incidente afecta a cierto número de empleados internos, clientes externos o la operación correcta de una función clave o si tiene un impacto financiero importante, entonces, el incidente se convierte en un incidente de severidad alta. El incidente de severidad alta se vuelve una crisis o emergencia si las funciones afectadas suponen un riesgo a la integridad de la empresa.

Para entender por qué, es necesario entender cuál es el objetivo de la supervisión de incidentes y cuán importante es para los objetivos del centro de control.

Si el objetivo principal del CIOS es eliminar o reducir los impactos en la empresa a la cual le da servicio, entonces, la supervisión del CIOS tiene que asegurarse de que el equipo de supervisión de incidentes esté trabajando diligentemente para resolver cualquier incidente importante. Lo anterior es mucho más fácil de hacer cuando este equipo está dentro del CIOS y le reporta a la misma supervisión.

Llevar la supervisión de un incidente cuando el equipo que está atendiendo el proceso de resolución del incidente no te reporta directamente es muy complicado.

  1. El equipo de supervisión de incidentes no solo debe estar en la misma locación, sino que debe reportar directamente al director del centro de control.
  2. El director del centro de control es el principal responsable de que se cumplan los objetivos y de que los problemas sean resueltos en buen tiempo.
  3. Cuando ocurren demasiados incidentes o toma más tiempo su resolución, normalmente, es el director del centro de control el responsable.

Las actividades y responsabilidades más grandes del equipo de supervisión de incidentes incluyen los siguientes:

  1. Supervisar todos los incidentes de severidad 1 y severidad 2 hasta su resolución.
  2. Notificar a la dirección y a soporte técnico de los incidentes.
  3. Crear y actualizar tickets de problemas.
  4. Abrir y dirigir puentes de conferencia.
  5. Involucrar a todos los equipos de emergencia y soporte cuando sean necesarios.
  6. Resolver los tickets de problemas.


Supervisión de incidentes

Roles y responsabilidades de los miembros del equipo de supervisión de incidentes:

  1. Supervisar todos los incidentes de severidad 1y 2 hasta su conclusión.
  2. Clasificar y categorizar adecuadamente todos los incidentes.
  3. Actualizar y revisar la base de datos de errores conocidos.
  4. Notificar a la gerencia y a soporte técnico cuando se necesite.
  5. Crear (si aún no se hace de manera automatizada o no lo ha hecho la unidad que reporta el incidente) y actualizar tickets de problema de los incidentes.
  6. Abrir y dirigir puente de conferencias para la resolución de incidentes.
  7. Involucrar a todos los equipos de soporte y emergencias cuando se requiera.
  8. Resolver los tickets de problemas.
  9. Producir reportes de supervisión diarios, semanales y mensuales.
  10. Medir resultados contra objetivos de negocio y hacer recomendaciones para mejoras.
  11. Asegura los objetivos a nivel de servicio por medio de resolución de incidentes, notificación a soporte y escalaciones de supervisión.
  12. Revisar y actualizar regularmente los procesos y procedimientos de la supervisión de incidentes.
  13. Garantizar que a lo largo de toda la organización esté implementado un proceso de supervisión de incidentes consistente.