Ya es hora de que hablemos... ¡de Time to Resolve y MTTR! El tiempo de resolución es una métrica que existe desde que tengo uso de razón. Aunque el tiempo de resolución (o MTTR, por sus siglas en inglés) no es nuevo, es hora de que lo analicemos más detenidamente y desentrañemos qué significa realmente el tiempo de resolución.
¿Por qué ahora? Porque el tiempo de resolución importa... ¡Mucho! Y el tiempo de resolución es, en esencia, un indicador de usabilidad y experiencia de usuario. También resulta ser una de esas métricas que se entienden y se interpretan muy mal. Así que, ¡vamos a sacarle jugo!
En esta guía Tiempo de Resolver
¿Qué es el Tiempo de Resolver?
¿Qué quieres decir con "tiempo para resolver"?
El Tiempo de resolución (MTTR) nos da el tiempo medio que tarda en resolverse un caso o incidente con el mismo síntoma durante una interrupción o escenario de resolución de problemas:
Tiempo de resolución = tiempo desde el incidente hasta la resolución durante el tiempo de la interrupción
En esencia, el tiempo de resolución es un indicador que nos dice cuánto tiempo están esperando los usuarios por un error concreto. No importa si la gente tiene el mismo problema o experimenta otro distinto, sino si ya se ha encontrado antes con algo similar y cuánto tiempo tarda en volver a ponerse en marcha encontrando una solución.
MTTD y MTTR: ¿Cuál es la diferencia?
La MTTD y la MTTR están cortadas por el mismo patrón. Pero no son lo mismo. El MTTR nos indica el tiempo que se tarda en volver a poner en marcha un sistema, mientras que el MTTD nos da el tiempo transcurrido desde que se produjo una incidencia hasta que se resolvió. Para simplificar, en este post vamos a centrarnos en el tiempo de resolución, pero quería que conocieras la ligera diferencia entre MTTD y MTTR.
El MTTD se refiere al tiempo transcurrido desde el incidente hasta el momento de la resolución.
El MTTR se refiere al tiempo transcurrido desde el incidente hasta el momento de la resolución.
Ejemplo: Hora del incidente (TOI) y Hora de resolución (TOR)
Es útil pensar en el MTTR de este modo: El problema se produce en el momento X, el usuario A tarda una media de tiempo Y en encontrar una solución y el problema se resuelve en el momento Z.
Además, ten en cuenta que MTTD significa el tiempo transcurrido desde que se produjo un incidente hasta que se resolvió, mientras que MTTR significa el tiempo transcurrido desde que se produjo el problema hasta que se resolvió. Esto puede parecer trivial, pero creo que todos nos hemos topado con esta confusión más de una vez, así que quería asegurarme de que quedaba meridianamente claro.
¿Cuándo debo medir el Tiempo para Resolver?
El Tiempo de resolución nos proporciona datos estupendos cuando necesitamos conocer la satisfacción de los usuarios con los errores recurrentes, es decir, los que presentan síntomas similares. Por ejemplo:
- ¿Por qué se ha vuelto a caer mi sitio? ¡Esto acaba de ocurrir la semana pasada! No puedo creer que no podáis evitar que esto ocurra una y otra vez...
- Después de actualizar mi navegador, sigo recibiendo este mensaje. ¿Podrías hacer que alguien le echara un vistazo?
- Las instrucciones que enviaste no eran claras. ¿Puede alguien echarles otro vistazo?
Si el tiempo de resolución es algo que puedes medir (y el tiempo de resolución es posible para todos), entonces el tiempo de resolución te ayudará a comprender el tiempo que tardan tus usuarios en volver a trabajar después de una interrupción. Básicamente, ¿cuánto tardaron los usuarios en volver a hacer su trabajo después de experimentar el problema?
Al fin y al cabo, ¡el "tiempo" es dinero! Así que vamos a ver cómo podemos asegurarnos de que el tiempo para resolver esté siempre disponible para su uso...
El tiempo hasta la resolución nos permite calcular el tiempo que tus usuarios están esperando a que se resuelva una incidencia. Luego podemos comparar esos datos a lo largo del tiempo y entre distintos equipos. Hay otros indicadores clave de rendimiento (KPI) que se utilizan para determinar si hay problemas en este ámbito: ¡el tiempo de resolución es uno de ellos!
¿Cómo mido el tiempo para Resolver?
En primer lugar, el Tiempo Hasta la Resolución debe medirse para poder utilizarse. El Tiempo Hasta la Resolución puede medirse de tres maneras: (1) tiempo desde el incidente hasta el momento de la resolución, (2) tiempo durante el tiempo de la interrupción, (3) tiempo desde el incidente hasta el momento del cierre. Cada método tiene sus ventajas e inconvenientes, así como la forma en que se puede comunicar, así que tenlo en cuenta cuando elijas un método para tu equipo. Veamos estos tres a continuación.
1.) Tiempo desde el incidente hasta el momento de la resolución: Esta es una métrica estupenda para los equipos que desean una respuesta rápida, ya que puedes extraer datos rápidamente después de que se haya producido una interrupción. Un inconveniente es que pierdes algunos datos históricos si algo no se ha resuelto en 72 horas (lo que antes se consideraba una buena práctica), pero esto reduce la velocidad en periodos de tiempo más largos, lo que podría ayudar con el tiempo para informar. ¡El tiempo de resolución durante el tiempo de interrupción es una de nuestras métricas de tiempo de resolución más populares!
2.) Tiempo desde el incidente hasta la hora de cierre Aquí tienes un ejemplo de tiempo desde la incidencia hasta la hora o tiempo de cierre, en el que puedes ver que pasaron 100 minutos entre el momento en que se inició el problema y el momento en que el usuario de este ticket concreto volvió a ponerse en marcha. Este método lleva más tiempo que extraer datos justo después de una interrupción, pero nos proporciona muchos más datos históricos durante un periodo de tiempo más largo. Estos datos pueden analizarse en diferentes equipos para profundizar realmente en qué es lo que más tarda (y por qué).
3.) Tiempo desde la identificación del problema hasta el cierre: Aquí tienes otro ejemplo de tiempo desde la hora de identificación del problema hasta la hora de cierre. Esta vez puedes ver que el usuario tardó 50 minutos en resolver su problema, y también está claro que esta vez se están extrayendo datos de hace varios días en lugar de sólo uno. Recuerda que esto es más difícil de obtener que los otros métodos, ya que los problemas tienden a actualizarse a medida que avanzan en tu flujo de trabajo, así que ten en cuenta que necesitamos al menos 24 horas entre actualizaciones antes de capturar cualquier dato de tiempo hasta la resolución.
Normalmente, el Tiempo hasta la Resolución (medición) se encuadra en una de estas tres categorías:
- durante el tiempo de interrupción (el tiempo de recogida de datos incluye el tiempo de inactividad y el tiempo que tarda el personal en solucionar el problema)
- después del tiempo de interrupción (días o semanas después de la recogida de datos)
- Tiempo en cola (hora de inicio en el sistema hasta la hora de cierre en el sistema).
Tus usuarios están esperando, ¿y ahora qué?
¡Aquí es donde el tiempo de resolución se vuelve complicado! Recuerda que el "tiempo" es dinero, así que es importante que te tomes tu tiempo para resolver los datos y convertirlos en algo útil. Algunas preguntas para ti podrían ser
- ¿Cuál es la magnitud real de este problema?
- ¿Qué aspecto tiene este problema a lo largo del tiempo? ¿Ves alguna tendencia en desarrollo?
- ¿Mi equipo está mejorando o empeorando a la hora de resolver problemas rápidamente?
Tomar tus datos de tiempo de resolución y convertirlos en algo útil puede ser difícil: a veces los equipos tienen mucha información, pero saben que no pueden hacer cambios sin datos de tiempo de resolución. Si obtienes datos sobre el tiempo de resolución, podrás no sólo compararte con tus colegas del sector, sino también ver la eficacia con la que empleas tu tiempo en este ámbito.
Consejos para disminuir el Tiempo hasta la Resolución y el MTTR
Así pues, ya sabes qué es el Tiempo hasta la Resolución, cómo medirlo y realizar su seguimiento. Ahora, quieres disminuir esta métrica tan importante. ¡Aquí tienes nuestros consejos favoritos!
- No tengas miedo de dejar de hacer algo que te consume mucho tiempo pero que carece de importancia. Si inviertes tu tiempo en muchas cosas que simplemente te hacen perder tiempo y no te aportan valor, puede que haya llegado el momento de reevaluar esas actividades.
- Empieza a utilizar (o continúa con) una plataforma de observabilidad o un sistema de gestión de incidencias como Pagerduty o alternativas en las que haya menos margen para el error, en lugar del correo electrónico o las hojas de cálculo, si es así como realizas actualmente el seguimiento de las incidencias. El correo electrónico puede perderse u olvidarse, las hojas de cálculo se vuelven desordenadas y confusas y, en última instancia, el tiempo seguirá pasando mientras vas de un lado a otro intentando resolver los problemas.
- Prioriza siempre tu trabajo: empieza primero por las tareas más importantes, ya que te llevarán más tiempo, y luego prioriza el tiempo que tardas en completar una tarea para ahorrar tiempo.
- Otras formas de mejorar el tiempo hasta la resolución son: tener un proceso claro y fácil de seguir, asegurarte de que tu equipo recibe la formación adecuada a todos los niveles y saber siempre qué tickets están en cola: ¡así sabrás exactamente cuántos usuarios te están esperando!
Reflexiones finales sobre el tiempo hasta la resolución y el MTTR
El tiempo hasta la resolución es un gran indicador de la calidad del trabajo informático. Se utiliza como indicación de que los problemas se están resolviendo correctamente y teniendo en cuenta la gestión del tiempo. Tener un índice eficiente de tiempo hasta la resolución significa que los problemas se están resolviendo lo suficientemente rápido como para que los equipos puedan abordar los problemas, pero no demasiado rápido como para que se considere que están "apagando fuegos" en lugar de profundizar realmente en el análisis de la causa raíz del problema. Un buen KPI de tiempo de resolución ayuda a los equipos a responder preguntas sobre el servicio al cliente, la eficacia, el tiempo dedicado a las tareas, etc., por lo que es importante no sólo "centrarse" en el tiempo de resolución, sino también comprender lo que significa para tu equipo.