Generar un incidente de forma automática a partir de una alerta de SCOM
SCOM es una herramienta de la suite de System Center 2012 R2 de Microsoft que se utiliza para monitorizar los dispositivos de una compañía. En las primeras versiones de SCOM estaba limitado a equipos con sistema operativo Windows, pero ahora podemos monitorizar equipos otros sistemas operativos como Linux y macOS. Esta herramienta nos permite llevar una monitorización minuciosa de nuestra infraestructura. Para ampliar la compatibilidad con nuestro SCOM, usamos los Management packs que nos permite que SCOM pueda interpretar toda la información que recibe nuestro servidor.
Microsoft System Center 2012 Service Manager es un producto de gestión de la suite System Center 2012. Puede ayudar a una empresa a automatizar y adaptar la gestión de los servicios de TI. SCSM incluye procesos integrados que abordan distintas situaciones que las empresas encontrarán. Como por ejemplo, la administrar los ciclos de vida de los activos y resolver los problemas e incidentes a medida que ocurren. La aplicación SCSM 2012 consta de tres niveles: una consola, un módulo de acceso a datos y una base de datos.
SCSM nos permite automatizar y adaptar los procedimientos recomendados de administración. Como los incluidos en Microsoft Operations Framework (MOF) e Information Technology Infrastructure Library (ITIL).
Estas dos potentes herramientas pueden trabajar de manera conjunta, creando automáticamente una incidencia en SCSM cuando en SCOM se genera una alerta.
Para que estas dos herramientas puedan trabajar juntas necesitamos conectar otra herramienta que forma parte de la suite, Orchestrator.
En conjunto de estas tres herramientas nos permite una flexibilidad. ES capaz de cubrir cualquier necesidad que tengamos y personalizar exponencialmente la gestión de nuestra infraestructura.
Juntando estas tres herramientas, adquirimos un gran control de nuestra red. Así mismo conseguimos la optimización de los tiempos de resolución de las incidencias. Por lo tanto se consigue disminuir los tiempos de caída del servicio. Si hemos firmado con un cliente una cláusula de SLA, este tipo de configuración puede ser lo que marque la diferencia a la hora de respetarlo y no llegar a incumplirlo.
Cuando tenemos una incidencia que se repite esta configuración nos es muy útil. La creación de un Runbook nos permite realizar comprobaciones previas o incluso solucionarla, permitiendo que podamos investigar el problema.
Un Runbook es una rutina de compilación de los procedimientos y operaciones. Normalmente son realizados por el administrador o el operador del sistema que integra el orchestrator. Nos permite sacar su máxima potencia con una buena configuración previa y conociendo los puntos críticos de nuestra infraestructura. Con ello podemos actuar automáticamente ante la caída de un servicio. Se encarga de los procedimientos más típicos (Reiniciar servicios, comprobar red, eliminar colas, etc). Esto conlleva un ahorro en los tiempos y costes. Normalmente este tipo de tareas serian derivadas al nivel 1. Se libera la carga estos últimos de tareas de problemas conocidos.
Daniel Sánchez Santamaría
Curso Microsoft MCSE Cloud Infrastructure 2016-2017
Centro de Formación Tajamar