Por qué medir tu IA en horas ahorradas te está saboteando el siguiente proyecto

Has lanzado el primer agente de IA y funciona. El equipo lo usa, los casos se procesan, el comité está contento. En la presentación del piloto pones la cifra estrella: “1.500 horas ahorradas al año, equivalente a 45.000 euros”. Todos asienten. El proyecto se aprueba. Seis meses después, cuando pides presupuesto para el siguiente caso, alguien pregunta dónde están esos 45.000 euros en la cuenta de resultados. Y ahí empieza el problema.

La métrica de horas ahorradas es la más usada para vender IA dentro de las empresas. También es la que más proyectos serios ha matado en su segunda ronda de financiación. Y casi nadie en tu organización ha dejado de usarla porque, en el primer pase, funciona muy bien.

Si vas a presentar un caso de IA este trimestre, este es el filtro que tienes que aplicar antes de meter una cifra de horas en cualquier slide.

Por qué la métrica de horas ahorradas convence al principio y traiciona después

El problema no es que sea falsa. El problema es que es una métrica de proxy. Mide algo que correlaciona con valor, pero no es valor. Y los proxys, en cualquier negocio serio, tienen fecha de caducidad muy corta.

En la primera presentación, la cifra funciona porque nadie tiene un punto de comparación. Dices “1.500 horas a 30 euros la hora” y nadie te discute ni el número de horas ni el coste hora. La aprobación llega.

A los seis meses, finanzas mira la cuenta de resultados. El equipo de operaciones tiene exactamente las mismas personas, cobrando lo mismo, ocupando los mismos puestos. La factura del modelo aparece como gasto nuevo. La línea de “horas ahorradas” no aparece en ningún sitio porque las horas no son un activo que se contabilice.

Si las horas ahorradas no se han traducido en menos coste, más ingreso o más capacidad, no han ahorrado nada. Han generado holgura, que es otra cosa. Y la holgura, sin un plan para reasignarla, se evapora en seis semanas porque el equipo encuentra otras tareas que llenan el hueco.

Lo que realmente está midiendo tu cifra de horas ahorradas

Cuando dices “este agente ahorra 1.500 horas al año”, estás midiendo tres cosas distintas y mezclándolas en un mismo número. Si no las separas, tu CFO va a hacerlo por ti en la siguiente reunión y tú no vas a tener respuestas.

Primero, tiempo bruto eliminado. Es el tiempo que la tarea ya no requiere de un humano. Es real, se mide bien y es el componente más fácil de defender.

Segundo, tiempo de revisión y supervisión. El agente trabaja, pero alguien revisa, corrige errores y da contexto. Ese tiempo casi nunca aparece en los cálculos iniciales y suele ser entre el 20% y el 40% del tiempo bruto eliminado. Es trabajo nuevo que tu cifra original ignora.

Tercero, tiempo de mantenimiento del sistema. El agente exige actualizaciones, ajuste de prompts, pruebas cuando cambia un modelo o un proceso. Ese tiempo lo paga alguien y casi nunca está en la fórmula.

Cuando restas honestamente las dos últimas a la primera, las 1.500 horas iniciales se convierten en algo entre 700 y 1.000 horas netas. Sigue siendo bueno. Pero no es lo que vendiste, y la diferencia es donde se rompe la confianza con finanzas.

Las tres preguntas que hacen explotar la métrica de horas en cualquier comité

Hay tres preguntas que un directivo financiero con experiencia hace cuando alguien le presenta un caso de IA basado en horas. Si no las has respondido antes de entrar en la sala, sales sin aprobación.

Pregunta uno: “¿Las personas que ahorran esas horas siguen en plantilla?” Si la respuesta es sí, el ahorro no es ahorro. Es capacidad ociosa redistribuida hacia otras tareas. Eso puede ser muy valioso, pero hay que cuantificar el valor de las nuevas tareas, no el coste de las eliminadas.

Pregunta dos: “¿Esas horas se han usado para hacer algo nuevo, vender más o atender más casos?” Esta pregunta separa los proyectos que escalan de los que se estancan. Si las horas se han usado para abrir un canal de ventas extra, atender un 30% más de tickets o entrar en un mercado nuevo, hay un caso defendible que puedes traducir a ingreso. Si nadie sabe qué se ha hecho con esas horas, el proyecto está en peligro.

Pregunta tres: “¿Qué pasa si retiramos el agente mañana?” Si la respuesta es “tendríamos que contratar a alguien para hacerlo”, el ahorro es real y se puede defender contra una contratación que no se hizo. Si la respuesta es “el equipo lo asumiría sin notarlo demasiado”, el ahorro nunca fue tan grande.

Estas tres preguntas son las que hace mentalmente cualquier CFO con criterio. Si no las contestas tú primero, las contesta él en su cabeza con el peor escenario.

Las métricas que sí defienden un caso de IA delante de finanzas

Si quieres que tu siguiente dossier pase, cambia las horas por una de estas cuatro métricas. Cualquiera de ellas habla el idioma de la cuenta de resultados.

Coste por unidad procesada antes y después. Si una factura, un ticket de soporte o un lead pasaba de costar 4 euros tratarlo y ahora cuesta 0,80, esa es una cifra defendible. Se puede multiplicar por volumen, proyectar a doce meses y ligar al margen del producto.
Capacidad adicional servida sin coste lineal. Si antes atendías 10.000 tickets al mes y ahora 14.000 con la misma plantilla, no estás ahorrando, estás creciendo. Esa cifra es la que un consejo entiende inmediatamente como apalancamiento.
Tiempo de ciclo de un proceso de negocio. Si el ciclo de cobro pasa de 38 a 24 días o el de cierre de venta de 21 a 12, ese cambio se traduce en caja, no en horas. Y la caja sí aparece en el balance.
Tasa de error o reproceso. Si bajas el porcentaje de pedidos con incidencia del 6% al 1,8%, eso reduce coste de servicio postventa, churn y reclamaciones. Cada uno de esos efectos tiene un valor concreto en tu cuenta.

Una sola de estas métricas, medida bien, vale más que cualquier presentación con horas ahorradas. Y obliga a que el caso de uso esté ligado a un proceso real, no a una tarea aislada.

Cómo redactar el éxito de un agente de IA antes de empezar

El error más habitual es decidir cómo medir el éxito cuando ya está implantado. Para entonces, todo el mundo ha asumido la métrica fácil y nadie quiere cambiarla.

Antes de aprobar el piloto, escribe en una página:

Métrica principal: una de las cuatro de arriba, con valor inicial medido y objetivo a 90 días.
Métrica secundaria: otra del mismo bloque, para evitar optimizar una sola dimensión a costa de la otra.
Indicador de salud: algo cualitativo que detecte regresión, como tasa de quejas, escalados a humano o satisfacción del cliente final.
Punto de corte: valor mínimo de la métrica principal a los 90 días por debajo del cual el proyecto se revisa, no se da por sentado.

Si el dueño del caso de uso, el responsable de operaciones y el director financiero firman esa hoja antes del lanzamiento, el proyecto deja de ser una promesa y se convierte en un compromiso medible. Esa firma, hecha al inicio, es lo que distingue una empresa que escala IA de una que la prueba.

Cierre: lo que mides es lo que defines como éxito, y lo que defines como éxito decide qué viene después

Tu primera implantación de IA define la conversación de las próximas. Si la mediste mal, vas a estar pagando esa mala definición durante dos años. No porque la tecnología falle, sino porque cada propuesta nueva entra a una mesa con la cicatriz de la anterior.

Las horas ahorradas son una buena conversación interna con tu equipo. Son una mala conversación con finanzas. Y son una pésima conversación con el consejo. Cambiar de métrica no es un detalle estético, es la diferencia entre que tu próximo proyecto se apruebe en la primera reunión o lleve tres meses dando vueltas.

La empresa que en dos años opera diez agentes en producción no es la que más rápido ahorró horas. Es la que aprendió a traducir cada caso de IA en una métrica que el director financiero ya estaba mirando. Cuando tu IA aparece en el panel de gestión, has dejado de defenderla. Empieza a defenderse sola.

🍪 Este sitio web utiliza cookies

Configuración de Cookies

Cookies Técnicas (Necesarias)

Cookies Analíticas