innovaorigen tech Agenda una llamada
Agenda una llamada

Inicio/Glosario/Agentes sobre CLI (harness)

IA

Agentes sobre CLI (harness)

Un agente sobre línea de comandos opera dentro de un harness: la capa de infraestructura que envuelve al modelo y le da capacidad de actuar sobre un entorno real. El modelo razona; el harness actúa.

Qué es

Un agente sobre CLI con harness es un agente de IA que vive en la terminal. El modelo de lenguaje aporta el razonamiento, pero por sí solo no toca nada: solo produce texto. El harness es la ingeniería que lo rodea y traduce ese razonamiento en acciones sobre un sistema real. En la terminal, eso significa leer y escribir ficheros, ejecutar comandos de shell, llamar a herramientas y a servidores MCP, y consultar logs.

El motor es un bucle de razonamiento y acción: el modelo decide una acción, el harness la ejecuta, reinyecta el resultado en el contexto y repite hasta completar la tarea. Sobre esa base, el harness gestiona el contexto, la planificación y la persistencia del progreso entre sesiones, apoyándose en ficheros, git y tests. A ello se suma el control: cada acción puede previsualizarse y aprobarse antes de ejecutarse, con modos de permiso configurables.

Lo distintivo no es el modelo, sino la ingeniería del harness. Ejemplos conocidos sirven solo de ilustración —Claude Code, Codex CLI, Gemini CLI, Copilot CLI, o proyectos de código abierto como Aider, Goose u OpenCode—; lo que separa a uno de otro es cómo resuelven contexto, control y trazabilidad.

Agentes sobre la CLI
Orquestación con control y trazabilidad
AGENTE
IA
CLI
Herramientas
Del entorno real.
ORQUESTA
Tareas
Trazable.

Por qué importa

Cuando un agente actúa sobre sistemas reales —ficheros, shell, servicios— la fiabilidad depende más del harness que del modelo. El modelo en sí es un LLM (modelo de lenguaje grande), que solo predice texto; sin la ingeniería que lo rodea no actúa. Un buen modelo razonando dentro de un harness pobre actúa a ciegas; un harness con contexto, control y trazabilidad acota el riesgo. La previsualización y aprobación de cada acción, junto a la auditoría paso a paso, permiten entender qué hizo el agente y por qué, en lugar de confiar a ciegas.

Estas capacidades son la base de patrones mayores: un Agente de IA y mesh de agentes, donde varios harness coordinados se comunican vía ACP · Agent Communication Protocol, y la Automatización con n8n, que orquesta esos agentes en flujos de trabajo. Su utilidad en analítica o SEO depende de las herramientas que el harness exponga —servidores MCP · Model Context Protocol que conectan al agente con APIs, datos o sistemas externos—. Es un término emergente, sin definición de glosario consolidada; las descripciones sólidas vienen hoy de fabricantes y divulgación técnica, y el material disponible está sesgado hacia el desarrollo de software más que hacia analítica, datos u operaciones.

En profundidad

Qué es un harness y qué lo distingue del modelo

El modelo es el motor de razonamiento; el harness es la infraestructura que lo conecta al entorno. Define qué herramientas existen, cómo se construye el contexto, qué se ejecuta y qué se registra. Dos agentes pueden usar el mismo modelo —el mismo LLM (modelo de lenguaje grande)— y comportarse de forma muy distinta según su harness. Por eso la ingeniería del harness —y no la elección del modelo— determina en buena medida la fiabilidad del agente.

CapaModeloHarness
FunciónRazona y proponeConecta al entorno y ejecuta
DecideQué acción tendría sentidoQué herramientas existen y qué se permite
ContextoLo consumeLo construye y lo reinyecta
RegistroNo persiste nadaTraza, guarda y audita

El bucle de razonamiento y acción sobre la terminal

El agente opera por iteración: el modelo propone una acción (leer un fichero, lanzar un comando, llamar a una herramienta o a un servidor MCP), el harness la ejecuta y devuelve el resultado al contexto, y el ciclo continúa hasta resolver la tarea. Esa conexión con herramientas externas se estandariza con el MCP · Model Context Protocol, que define cómo el agente descubre e invoca capacidades —desde un MCP para WordPress hasta connectors de datos—. Esta reinyección de resultados es lo que permite encadenar pasos y reaccionar a lo que ocurre en el sistema, en lugar de trabajar a ciegas sobre una sola respuesta.

1
Propone acción
El modelo elige leer fichero, lanzar comando o llamar a herramienta/MCP
2
Ejecuta
El harness corre la acción sobre la terminal
3
Reinyecta
El resultado vuelve al contexto del modelo
4
Itera
El ciclo se repite hasta resolver la tarea

Control: modos de permiso y aprobación

Actuar sobre un sistema real exige acotar qué puede hacer el agente sin supervisión. El harness puede previsualizar cada acción y pedir aprobación antes de ejecutarla, y ofrecer modos de permiso que gradúan la autonomía: desde confirmar todo hasta permitir clases de acciones consideradas seguras. Es la palanca para equilibrar velocidad y riesgo, y un pilar del Hardening y seguridad de servidores cuando el agente opera sobre infraestructura en producción.

ModoQué haceEquilibrio
Confirmar todoAprueba cada acción antes de ejecutarMáximo control, mínima velocidad
Acciones seguras autoPermite clases consideradas inocuas; pide el restoPunto intermedio
Autonomía ampliaEjecuta sin pausar salvo lo sensibleMáxima velocidad, más riesgo
PrevisualizaciónMuestra la acción antes de correrlaTransversal a todos los modos

Trazabilidad y persistencia de tareas multietapa

En tareas largas, el harness registra cada paso para que sea auditable y sostiene el progreso fuera del contexto del modelo: ficheros de trabajo, commits de git, resultados de tests. Así el avance no se pierde al agotar el contexto o entre sesiones, y queda un rastro de qué se hizo y por qué. Esta misma legibilidad para máquinas —dejar artefactos y estado que otro agente pueda leer— enlaza con la AUX · Agent Experience, la disciplina de diseñar sistemas para que los entiendan agentes y no solo humanos.

Cada paso queda registradoRastro auditable de qué se hizo y por qué
Progreso fuera del contextoFicheros de trabajo, commits de git, resultados de tests
Resiste el corte de sesiónEl avance no se pierde al agotar el contexto
Estado solo en el contexto del modeloSe pierde el progreso entre sesiones

Qué observar

Las señales que importan.

El modelo razona, el harness actúa

Separa con claridad las dos capas. El modelo solo produce texto; toda capacidad de leer ficheros, ejecutar shell o llamar herramientas la aporta la infraestructura que lo envuelve.

Bucle de razonamiento y acción

El harness ejecuta cada acción propuesta, reinyecta el resultado en el contexto y repite hasta cerrar la tarea. Es el mecanismo que convierte una respuesta en una secuencia de pasos sobre el entorno.

Previsualización y aprobación de acciones

Antes de tocar el sistema, la acción puede mostrarse y requerir confirmación. Los modos de permiso definen qué se ejecuta solo y qué necesita visto bueno humano.

Trazabilidad paso a paso

Cada acción queda observable y auditable. Permite reconstruir qué hizo el agente y por qué, condición básica para operarlo sobre sistemas reales.

Persistencia entre sesiones

El progreso de tareas multietapa se sostiene fuera de la memoria del modelo —en ficheros, git y tests—, de modo que el trabajo sobrevive al reinicio del contexto.

Conceptos clave

El vocabulario del término.

Harness
Capa de infraestructura que envuelve al modelo y le da capacidad de actuar sobre un entorno real: gestiona herramientas, contexto, ejecución, control y registro. El modelo razona; el harness actúa.
Línea de comandos (CLI)
Interfaz de terminal sobre la que opera el agente. Es donde lee y escribe ficheros, ejecuta comandos de shell, llama a herramientas y consulta logs.
Bucle de razonamiento y acción
Mecanismo iterativo en el que el modelo propone una acción, el harness la ejecuta y reinyecta el resultado en el contexto, repitiendo hasta completar la tarea.
Modos de permiso
Configuración que gradúa la autonomía del agente: define qué acciones se ejecutan automáticamente y cuáles requieren aprobación humana previa.
Trazabilidad
Capacidad de observar y auditar paso a paso lo que hace el agente, para reconstruir qué acciones tomó y por qué.
Servidor MCP
Herramienta externa que el harness puede invocar a través del protocolo de contexto para extender lo que el agente puede consultar o ejecutar. Detalle en su ficha propia.

Dónde lo aplicamos

Casos de uso · Agentes sobre CLI (harness)[PENDIENTE]

Aún no mostramos casos.

No inventamos resultados. Cuando tengamos casos reales —anonimizados y medibles— donde este concepto marcó la diferencia, vivirán aquí.

Una pieza del glosario.

Forma parte del glosario de SEO, analítica e IA de InnovaOrigen Tech: un mapa de conceptos definidos con criterio y fuentes. Si quieres llevarlo a tu caso, lo vemos sin compromiso.