Token Budget
El gasto máximo de cómputo autorizado por período de tiempo, funcionando como un interruptor de circuito contra bucles de agente descontrolados.
Definición
Un Token Budget es el gasto máximo de cómputo autorizado para la ejecución del agente dentro de un período de tiempo determinado. Funciona como una restricción estricta, no como una guía de asesoramiento, que previene costos descontrolados y fuerza la priorización del trabajo del agente. Cuando el presupuesto se agota, el agente se detiene y la tarea se escala a un humano.
Los Token Budgets operan en múltiples niveles:
- Presupuestos por Tarea — cada tarea individual tiene una asignación máxima de tokens. Si un agente excede este límite, la ejecución se detiene y se levanta una Bandera de Bloqueo.
- Límites por Bucle — dentro de una tarea, cada iteración del bucle de ejecución del agente tiene un límite superior para prevenir ciclos de reintento infinitos.
- Asignación Semanal — el gasto total de cómputo para el equipo se establece durante las sesiones semanales de Planificación de Contexto y Asignación.
Los Token Budgets previenen el modo de falla más común en los equipos agénticos: bucles de agente descontrolados que consumen grandes cantidades de cómputo sin producir valor incremental. Se aplican en la Capa de Orquestación y se rastrean en tiempo real en el Panel de Control de AgentOps, donde el Gerente de Flujo monitorea el consumo frente a la asignación semanal.