Glosario
EvaluaciónEmergente

Eficiencia de Flujo

La relación entre el tiempo de cómputo activo del agente y el tiempo total de reloj, que mide cuánto tiempo los agentes pasan trabajando frente a esperando.

Definición

La Eficiencia de Flujo mide la relación entre el tiempo de cómputo activo del agente y el tiempo total de reloj para una tarea. Se calcula como:

Tiempo de cómputo activo / Tiempo total desde la asignación de la tarea hasta la entrega del PR

El tiempo de cómputo activo incluye todos los períodos en que el agente está generando código, ejecutando pruebas o interactuando con el Eval Harness. El tiempo total incluye todo, desde el momento en que se asigna una tarea a un agente hasta que se envía la solicitud de extracción final (PR) — incluyendo todos los estados de espera, tiempo de cola y demoras en la revisión humana.

Rangos objetivo:

  • Por encima de 0.6 — los agentes pasan más del 60% de su tiempo asignado trabajando activamente. Esto indica una pipeline que funciona bien con cuellos de botella mínimos.
  • 0.4 a 0.6 — eficiencia moderada con factores de arrastre identificables. La mejora es posible al abordar estados de espera específicos.
  • Por debajo de 0.4 — el cuello de botella está en los procesos humanos, no en la velocidad del agente. Los agentes pasan más tiempo esperando que trabajando, lo que significa que agregar más agentes no aumentará el rendimiento.

Factores de arrastre comunes que reducen la Eficiencia de Flujo:

  1. Acumulación en la cola de revisión — el trabajo completado del agente espera la revisión humana. Esta es la causa más común de baja Eficiencia de Flujo y se aborda mejorando la Operator Leverage Ratio.
  2. Retrasos en la preparación del contexto — los Live Specs y los Paquetes de Contexto no están listos cuando los agentes están disponibles, creando tiempo de inactividad al inicio de la pipeline.
  3. Tiempos de espera de infraestructura — el aprovisionamiento de Ephemeral Workbenches, la descarga de dependencias o la espera de la disponibilidad de servicios externos añade tiempo no productivo.
  4. Latencia de Misión de Rescate — cuando un agente levanta una Blocker Flag, el tiempo entre la bandera y la respuesta del operador es tiempo de espera puro.

La Eficiencia de Flujo se monitorea en el AgentOps Dashboard y se revisa durante el Daily Flow Sync. Complementa el seguimiento del Token Budget: una baja Eficiencia de Flujo con un bajo gasto de tokens indica que la pipeline está privada de atención humana, mientras que una baja Eficiencia de Flujo con un alto gasto de tokens indica que los agentes están reintentando enfoques fallidos.

Última actualización: 3/11/2026