Ingeniería de Contexto
Organización y mantenimiento del conjunto óptimo de tokens y datos de estado durante la inferencia de LLM.
Definición
La ingeniería de contexto es la práctica de diseñar, organizar y gestionar deliberadamente la información que fluye hacia la ventana de contexto de un modelo de lenguaje extenso (LLM) para maximizar la calidad y relevancia de sus resultados. Mientras que el prompt engineering se centra en la elaboración de instrucciones individuales, la ingeniería de contexto adopta una visión a nivel de sistema sobre cómo se ensamblan y priorizan todas las piezas del contexto, incluidos los prompts del sistema, los documentos recuperados, el historial de conversaciones, las salidas de herramientas y las entradas del usuario.
Las características clave de la ingeniería de contexto incluyen:
-
Arquitectura de la Información: Los profesionales deciden qué información incluir, excluir, resumir o posponer, tratando la ventana de contexto como un recurso escaso que debe asignarse estratégicamente.
-
Ensamblaje Dinámico de Contexto: En lugar de prompts estáticos, la ingeniería de contexto implica la creación de pipelines que ensamblan el contexto dinámicamente basándose en la tarea actual, el estado del usuario y la información disponible.
-
Gestión de Estado: En flujos de trabajo de múltiples turnos o agénticos, los ingenieros de contexto diseñan cómo se comprime el historial de conversación, qué salidas de herramientas se conservan y cuándo restablecer o resumir el estado acumulado.
-
Integración de Recuperación: La ingeniería de contexto determina cómo y cuándo extraer conocimiento externo a través de RAG, equilibrando la relevancia de la recuperación con la capacidad de la ventana de contexto.
-
Impulsado por la Evaluación: La ingeniería de contexto efectiva requiere medir la calidad de los resultados frente a diferentes configuraciones de contexto, tratando el diseño del contexto como un problema de optimización empírica en lugar de una configuración única.
En el Agentic Development Handbook, la ingeniería de contexto es la base del pilar Context-First Architecture. El Context Index sirve como el registro canónico que mapea cada artefacto del proyecto —registros de decisiones de arquitectura, grafos de dependencias, guías de estilo y archivos de prueba— a una ubicación recuperable que los agentes pueden consultar en el momento de la tarea. Los Context Packets son el mecanismo de entrega: paquetes de archivos, reglas y referencias a Live Spec con un alcance definido, ensamblados para una sola tarea de agente para que el modelo reciba precisamente la información que necesita sin agotar su presupuesto de tokens.