Qué es
Un agente sobre CLI con harness es un agente de IA que vive en la terminal. El modelo de lenguaje aporta el razonamiento, pero por sí solo no toca nada: solo produce texto. El harness es la ingeniería que lo rodea y traduce ese razonamiento en acciones sobre un sistema real. En la terminal, eso significa leer y escribir ficheros, ejecutar comandos de shell, llamar a herramientas y a servidores MCP, y consultar logs.
El motor es un bucle de razonamiento y acción: el modelo decide una acción, el harness la ejecuta, reinyecta el resultado en el contexto y repite hasta completar la tarea. Sobre esa base, el harness gestiona el contexto, la planificación y la persistencia del progreso entre sesiones, apoyándose en ficheros, git y tests. A ello se suma el control: cada acción puede previsualizarse y aprobarse antes de ejecutarse, con modos de permiso configurables.
Lo distintivo no es el modelo, sino la ingeniería del harness. Ejemplos conocidos sirven solo de ilustración —Claude Code, Codex CLI, Gemini CLI, Copilot CLI, o proyectos de código abierto como Aider, Goose u OpenCode—; lo que separa a uno de otro es cómo resuelven contexto, control y trazabilidad.
Por qué importa
Cuando un agente actúa sobre sistemas reales —ficheros, shell, servicios— la fiabilidad depende más del harness que del modelo. El modelo en sí es un LLM (modelo de lenguaje grande), que solo predice texto; sin la ingeniería que lo rodea no actúa. Un buen modelo razonando dentro de un harness pobre actúa a ciegas; un harness con contexto, control y trazabilidad acota el riesgo. La previsualización y aprobación de cada acción, junto a la auditoría paso a paso, permiten entender qué hizo el agente y por qué, en lugar de confiar a ciegas.
Estas capacidades son la base de patrones mayores: un Agente de IA y mesh de agentes, donde varios harness coordinados se comunican vía ACP · Agent Communication Protocol, y la Automatización con n8n, que orquesta esos agentes en flujos de trabajo. Su utilidad en analítica o SEO depende de las herramientas que el harness exponga —servidores MCP · Model Context Protocol que conectan al agente con APIs, datos o sistemas externos—. Es un término emergente, sin definición de glosario consolidada; las descripciones sólidas vienen hoy de fabricantes y divulgación técnica, y el material disponible está sesgado hacia el desarrollo de software más que hacia analítica, datos u operaciones.
En profundidad
Qué es un harness y qué lo distingue del modelo
El modelo es el motor de razonamiento; el harness es la infraestructura que lo conecta al entorno. Define qué herramientas existen, cómo se construye el contexto, qué se ejecuta y qué se registra. Dos agentes pueden usar el mismo modelo —el mismo LLM (modelo de lenguaje grande)— y comportarse de forma muy distinta según su harness. Por eso la ingeniería del harness —y no la elección del modelo— determina en buena medida la fiabilidad del agente.
| Capa | Modelo | Harness |
|---|---|---|
| Función | Razona y propone | Conecta al entorno y ejecuta |
| Decide | Qué acción tendría sentido | Qué herramientas existen y qué se permite |
| Contexto | Lo consume | Lo construye y lo reinyecta |
| Registro | No persiste nada | Traza, guarda y audita |
El bucle de razonamiento y acción sobre la terminal
El agente opera por iteración: el modelo propone una acción (leer un fichero, lanzar un comando, llamar a una herramienta o a un servidor MCP), el harness la ejecuta y devuelve el resultado al contexto, y el ciclo continúa hasta resolver la tarea. Esa conexión con herramientas externas se estandariza con el MCP · Model Context Protocol, que define cómo el agente descubre e invoca capacidades —desde un MCP para WordPress hasta connectors de datos—. Esta reinyección de resultados es lo que permite encadenar pasos y reaccionar a lo que ocurre en el sistema, en lugar de trabajar a ciegas sobre una sola respuesta.
Control: modos de permiso y aprobación
Actuar sobre un sistema real exige acotar qué puede hacer el agente sin supervisión. El harness puede previsualizar cada acción y pedir aprobación antes de ejecutarla, y ofrecer modos de permiso que gradúan la autonomía: desde confirmar todo hasta permitir clases de acciones consideradas seguras. Es la palanca para equilibrar velocidad y riesgo, y un pilar del Hardening y seguridad de servidores cuando el agente opera sobre infraestructura en producción.
| Modo | Qué hace | Equilibrio |
|---|---|---|
| Confirmar todo | Aprueba cada acción antes de ejecutar | Máximo control, mínima velocidad |
| Acciones seguras auto | Permite clases consideradas inocuas; pide el resto | Punto intermedio |
| Autonomía amplia | Ejecuta sin pausar salvo lo sensible | Máxima velocidad, más riesgo |
| Previsualización | Muestra la acción antes de correrla | Transversal a todos los modos |
Trazabilidad y persistencia de tareas multietapa
En tareas largas, el harness registra cada paso para que sea auditable y sostiene el progreso fuera del contexto del modelo: ficheros de trabajo, commits de git, resultados de tests. Así el avance no se pierde al agotar el contexto o entre sesiones, y queda un rastro de qué se hizo y por qué. Esta misma legibilidad para máquinas —dejar artefactos y estado que otro agente pueda leer— enlaza con la AUX · Agent Experience, la disciplina de diseñar sistemas para que los entiendan agentes y no solo humanos.
Qué observar
Las señales que importan.
El modelo razona, el harness actúa
Separa con claridad las dos capas. El modelo solo produce texto; toda capacidad de leer ficheros, ejecutar shell o llamar herramientas la aporta la infraestructura que lo envuelve.
Bucle de razonamiento y acción
El harness ejecuta cada acción propuesta, reinyecta el resultado en el contexto y repite hasta cerrar la tarea. Es el mecanismo que convierte una respuesta en una secuencia de pasos sobre el entorno.
Previsualización y aprobación de acciones
Antes de tocar el sistema, la acción puede mostrarse y requerir confirmación. Los modos de permiso definen qué se ejecuta solo y qué necesita visto bueno humano.
Trazabilidad paso a paso
Cada acción queda observable y auditable. Permite reconstruir qué hizo el agente y por qué, condición básica para operarlo sobre sistemas reales.
Persistencia entre sesiones
El progreso de tareas multietapa se sostiene fuera de la memoria del modelo —en ficheros, git y tests—, de modo que el trabajo sobrevive al reinicio del contexto.
Conceptos clave
El vocabulario del término.
- Harness
- Capa de infraestructura que envuelve al modelo y le da capacidad de actuar sobre un entorno real: gestiona herramientas, contexto, ejecución, control y registro. El modelo razona; el harness actúa.
- Línea de comandos (CLI)
- Interfaz de terminal sobre la que opera el agente. Es donde lee y escribe ficheros, ejecuta comandos de shell, llama a herramientas y consulta logs.
- Bucle de razonamiento y acción
- Mecanismo iterativo en el que el modelo propone una acción, el harness la ejecuta y reinyecta el resultado en el contexto, repitiendo hasta completar la tarea.
- Modos de permiso
- Configuración que gradúa la autonomía del agente: define qué acciones se ejecutan automáticamente y cuáles requieren aprobación humana previa.
- Trazabilidad
- Capacidad de observar y auditar paso a paso lo que hace el agente, para reconstruir qué acciones tomó y por qué.
- Servidor MCP
- Herramienta externa que el harness puede invocar a través del protocolo de contexto para extender lo que el agente puede consultar o ejecutar. Detalle en su ficha propia.
Dónde lo aplicamos
Aún no mostramos casos.
No inventamos resultados. Cuando tengamos casos reales —anonimizados y medibles— donde este concepto marcó la diferencia, vivirán aquí.
Conceptos relacionados
Fuentes
Una pieza del glosario.
Forma parte del glosario de SEO, analítica e IA de InnovaOrigen Tech: un mapa de conceptos definidos con criterio y fuentes. Si quieres llevarlo a tu caso, lo vemos sin compromiso.