Cost per Feature
O custo total de entrega de cada Feature através da execução do agente, incluindo o consumo de tokens da API, infraestrutura de computação, supervisão humana e esforço de revisão.
Definição
Cost per Feature é o custo total de entrega de cada Feature através da execução do agente. Ele agrega quatro componentes de custo:
- Consumo de tokens da API — o total de tokens consumidos em todas as execuções do agente necessárias para completar a Feature, incluindo retentativas, intervenções de Rescue Mission e passagens de avaliação.
- Infraestrutura de computação — o custo de provisionamento de Ephemeral Workbench, tempo de execução do ambiente de teste e qualquer infraestrutura de suporte utilizada durante a execução.
- Tempo de supervisão humana — o custo de mão de obra do tempo de Context Architect gasto escrevendo Live Specs, tempo do Agent Operator gasto em supervisão e Rescue Missions, e tempo do Evaluation Engineer gasto mantendo o Eval Harness.
- Esforço de revisão — o custo de mão de obra da revisão de código humana após a saída do agente passar pela avaliação automatizada.
Cost per Feature é calculado por Feature entregue:
Custo total (tokens + computação + supervisão + revisão) / Número de Features entregues
Essa métrica determina se o desenvolvimento agêntico é economicamente viável para uma determinada equipe e perfil de trabalho. Se as Features entregues por agentes consistentemente custarem mais do que as Features equivalentes entregues por humanos — incluindo o salário integral, benefícios e despesas gerais de uma equipe tradicional — então o investimento não está valendo a pena para essa categoria de trabalho.
Três estratégias reduzem o Cost per Feature:
- Memória de longo prazo e cache — o armazenamento em cache de contexto frequentemente usado, soluções anteriores para problemas semelhantes e artefatos de dependência compilados reduz o custo de token e computação de cada execução. Agentes que começam com contexto relevante em cache consomem menos tokens para chegar a uma solução.
- Otimização de roteamento de tarefas — rotear apenas tarefas com ROI positivo para agentes e manter tarefas com ROI negativo com desenvolvedores humanos. Nem todo trabalho se beneficia igualmente da execução do agente. Tarefas rotineiras e bem especificadas com padrões claros tendem a ter um Cost per Feature baixo, enquanto trabalhos novos ou ambíguos tendem a ter um Cost per Feature alto.
- Seleção de modelo — usar modelos menores e menos caros para tarefas rotineiras e reservar modelos maiores para trabalhos complexos. Uma tarefa que pode ser concluída corretamente por um modelo menor não deve consumir o Token Budget de um modelo de fronteira.
Cost per Feature é revisado durante a FinOps Review mensal, juntamente com as tendências de Blended Efficiency e Token Budget. Juntas, essas três métricas fornecem o caso econômico para o desenvolvimento agêntico no nível da unidade (Cost per Feature), nível da equipe (Blended Efficiency) e nível do recurso (Token Budget).