Por qué los runbooks importan
La mayoría de los equipos no tienen problemas para detectar vulnerabilidades. El problema está en lo que ocurre después: quién es responsable, en qué plazo, qué constituye una remediación válida, y cómo se documenta para una auditoría futura.
Sin un proceso definido, la respuesta a una vulnerabilidad depende de quién esté disponible ese día, de si el ticket llega al equipo correcto y de cuánto ruido genera el CVE en ese momento. Un runbook cambia eso: convierte la respuesta en un proceso repetible, con responsables claros, criterios de cierre explícitos y evidencia generada en cada paso.
Los 6 pasos
-
Paso 1
Detección y registro
La vulnerabilidad puede llegar de múltiples fuentes: output de un escáner, alerta de KEV de CISA, advisory del fabricante, notificación de un CERT o reporte interno. El origen no importa tanto como lo que se hace con ella en los primeros minutos.
Lo que hay que registrar en este paso: ID del CVE, puntuación CVSS, EPSS si está disponible, fecha y hora de detección, y fuente de la alerta. El objetivo es abrir un caso con suficiente información para que cualquier miembro del equipo pueda continuar desde aquí.
Output: ticket o caso abierto en el sistema de gestión con los metadatos del CVE.
-
Paso 2
Correlación con inventario
Antes de evaluar nada, hay que saber si el CVE afecta a activos propios. La correlación cruza el componente afectado (fabricante, producto, versión) contra el inventario de software y activos.
El resultado de este paso es una lista de activos afectados, clasificados por entorno: producción, staging, desarrollo. Un CVE que solo afecta a entornos de desarrollo tiene un perfil de riesgo muy diferente a uno que afecta a sistemas productivos.
Si la correlación no encuentra ningún activo afectado, el caso se cierra con justificación documentada. Eso también es evidencia: demuestra que el proceso se ejecutó.
Output: lista de activos afectados con entorno, o cierre justificado si no hay afectación.
-
Paso 3
Evaluación de riesgo por activo
El riesgo no es igual para todos los activos afectados. Este paso evalúa cada uno de forma independiente, considerando: exposición a internet, criticidad de negocio del activo, datos que maneja, y controles compensatorios ya existentes (WAF, segmentación de red, autenticación fuerte).
El resultado es una clasificación de riesgo por activo, no por CVE. Un mismo CVE puede ser crítico en un activo y bajo en otro, dependiendo de su contexto. Esta distinción es lo que hace posible priorizar con criterio.
Output: clasificación de riesgo (Crítico / Alto / Medio / Bajo) por activo, con la justificación de cada decisión.
-
Paso 4
Asignación de responsable y SLA
Cada activo afectado necesita un propietario para la remediación. Sin asignación explícita, el caso queda en tierra de nadie.
El SLA arranca en el momento de la asignación. Un esquema típico basado en la clasificación del paso anterior: Crítico → 24 horas, Alto → 72 horas, Medio → 2 semanas, Bajo → próximo ciclo de mantenimiento. Los plazos exactos dependen de la política de cada organización, pero tienen que existir y ser explícitos.
Si el CVE está en el KEV de CISA, el SLA se acorta automáticamente independientemente de la clasificación interna.
Output: tickets asignados con responsable y fecha límite documentados.
-
Paso 5
Remediación o mitigación
Existen dos caminos, y a veces hay que combinarlos:
Parche: Si existe una versión corregida del componente y el proceso de testing lo permite, es la opción de cierre definitivo. Documenta la versión antes y después del parche, y la fecha de aplicación.
Mitigación temporal: Cuando el parche no está disponible, no ha pasado un ciclo de testing suficiente, o el activo no puede caer en ese momento. Las mitigaciones típicas incluyen: regla de WAF, bloqueo a nivel de red, desactivación de la funcionalidad afectada, o aislamiento temporal del activo. Cada mitigación debe documentar su alcance exacto, sus limitaciones, y la fecha prevista de aplicación del parche definitivo.
Output: registro de cambio con la acción tomada, la persona responsable, la fecha y la evidencia (captura de versión, log de cambio, ticket de cambio en ITSM).
-
Paso 6
Validación y cierre
La remediación no está completa hasta que se verifica. Un parche aplicado sin validación posterior es una remediación a medias: sabes que lo aplicaste, pero no que funcionó.
Para parches: ejecutar un escaneo de confirmación o verificar manualmente la versión instalada del componente. El resultado del escaneo es la evidencia de cierre.
Para mitigaciones temporales: programar una revisión para la aplicación del parche definitivo. La mitigación cierra el caso de forma provisional, pero el caso no se cierra completamente hasta que se aplica la solución permanente.
Output: registro de cierre con evidencia de validación. Si es cierre provisional por mitigación, fecha comprometida para el cierre definitivo.
Qué evidencia generar en cada paso
Un runbook sin evidencia es un proceso sin trazabilidad. Para auditorías de NIS2, ENS o ISO 27001, la pregunta no es solo "¿lo parcheaste?" sino "¿puedes demostrar que lo parcheaste y cuándo?". Estos son los registros mínimos por paso:
- Detección: fecha, fuente y metadatos del CVE.
- Correlación: lista de activos comprobados y resultado de la correlación.
- Evaluación: clasificación de riesgo por activo con justificación.
- Asignación: responsable, fecha de asignación y SLA.
- Remediación: acción tomada, versión antes/después o mitigación aplicada.
- Validación: resultado del escaneo de confirmación o verificación de versión.
Errores habituales al implementar un runbook
- Definir el runbook sin SLAs. Un proceso sin plazos explícitos no genera urgencia. El SLA es lo que convierte el runbook en un compromiso.
- Cerrar casos sin validar. Marcar una vulnerabilidad como resuelta sin verificación posterior invalida el cierre. En una auditoría, "aplicamos el parche" sin evidencia de confirmación no es suficiente.
- No documentar las mitigaciones temporales. Una mitigación sin fecha de cierre definitivo se convierte fácilmente en permanente. Si no está documentado, no hay presión para resolverlo.
- Un único responsable para todos los activos. La asignación debe llegar al propietario real del activo, no a un buzón genérico de seguridad. El responsable tiene que poder ejecutar la remediación o escalarla.
- No revisar el runbook tras un incidente. El runbook es un documento vivo. Cada vez que algo falla en el proceso —un activo que no estaba en el inventario, un plazo que no se cumplió— es una oportunidad de mejorarlo.
Remediación con trazabilidad desde el paso 1
vulloop integra correlación de inventario, asignación de responsable, seguimiento de SLA y evidencia auditable en un único flujo de trabajo.