Tag: Programación

Context Engineering: proyectos con IA sin perder el hilo

La primera vez que me pasó, pensé que era un fallo del modelo.

Llevaba tres días construyendo una API con Claude Code. Arquitectura decidida, endpoints definidos, estructura de carpetas lista. Todo tenía sentido. Abrí una sesión nueva al cuarto día y le pedí que añadiera autenticación al módulo de usuarios.

Me devolvió código que contradecía las decisiones que habíamos tomado el día anterior. Naming diferente. Patrón de errores distinto. Como si hubiera arrancado desde cero.

No era un fallo del modelo. Era un fallo mío. No le había dado context engineering. Le había dado prompts.

Lo que me faltaba tiene nombre. Y no es lo mismo que prompt engineering.

El problema real: el modelo no sabe qué decidiste ayer

Los LLMs no tienen memoria entre sesiones. Cada conversación nueva es, literalmente, una pizarra en blanco.

Dentro de una misma sesión tienen una ventana de contexto — los modelos actuales manejan ventanas de entre 128k tokens (GPT-4o) y 200k tokens (Claude 3.5/3.7), cifras de junio 2026 que seguirán creciendo — pero esa ventana se llena. Y cuando se llena, el modelo empieza a “olvidar” las partes más antiguas de la conversación. Las decisiones de arquitectura que tomaste al principio. Las convenciones de naming que acordaste. El motivo por el que descartaste la opción B.

El resultado es predecible: inconsistencia. Código que contradice decisiones previas. Respuestas que suenan razonables pero no encajan con el proyecto real. Y tú volviendo a explicar, sesión tras sesión, qué estás construyendo y cómo.

Cualquier developer que haya usado IA durante más de dos semanas en un proyecto real lo ha vivido. La inconsistencia entre sesiones es la fricción número uno.

Context engineering no es prompt engineering

Mucha gente confunde los dos. No son lo mismo.

Prompt engineering trata una sola interacción. Cómo formular la pregunta. Qué ejemplos incluir. Qué rol asignarle al modelo. Es útil, pero es táctica de un solo turno.

Context engineering es la disciplina de estructurar y gestionar toda la información que recibe el modelo para que produzca resultados consistentes a lo largo de un proyecto completo. No en un prompt. En semanas de trabajo.

La diferencia es la misma que hay entre saber hacer una buena pregunta en una entrevista y saber gestionar a un equipo durante un sprint.

Prompt Engineering	Context Engineering
Alcance	Un turno de conversación	Un proyecto completo
Problema que resuelve	Calidad de una respuesta	Consistencia entre sesiones
Habilidad principal	Redactar instrucciones claras	Diseñar sistemas de información
Cuándo falla	Respuesta ambigua o incorrecta	Proyecto incoherente en semana 3
Herramienta clave	El prompt en sí	CLAUDE.md, specs, logs de decisiones

Puedes ser un maestro del prompt engineering y aun así tener un proyecto que se rompe cada semana. El context engineering es lo que lo sostiene.

Las 4 técnicas que uso en producción

1. CLAUDE.md / AGENTS.md — la memoria persistente del proyecto

Este es el punto de partida. Un archivo en la raíz del proyecto que le dice al modelo, al inicio de cada sesión, quién eres, qué estás construyendo y cómo trabajas.

No es un README. Es un system prompt que el modelo lee antes de hacer nada.

Lo mínimo que debe tener:

Descripción del proyecto en 2-3 líneas (qué es, para quién)
Stack técnico con versiones concretas
Convenciones de código que no se negocian
Lo que NO debe hacer el modelo (igual de importante)
Estado actual del proyecto — en qué fase estás

Un ejemplo mínimo que uso en proyectos reales:

# CLAUDE.md — API de Usuarios

## Proyecto
API REST de gestión de usuarios para SaaS B2B.
Stack: NestJS 10 + PostgreSQL + Prisma 5.

## Convenciones
- Naming: camelCase para variables, PascalCase para clases, kebab-case para archivos
- Errores: siempre usar HttpException con código y mensaje estructurado
- No usar `any` en TypeScript — tipos explícitos o `unknown`

## NO hacer
- No generar migraciones de Prisma automáticamente — las revisamos manualmente
- No cambiar el schema sin actualizar architecture.md

## Estado actual
Fase 2 — módulo de autenticación JWT. Ver tasks.md para detalle.

Si usas Claude Code, este archivo es CLAUDE.md. Si usas Cursor o Windsurf, es __INLINE_PLACEHOLDER_0__ o __INLINE_PLACEHOLDER_1__ (__INLINE_PLACEHOLDER_2__ sigue siendo compatible pero es el formato legacy de Cursor). El nombre cambia. El concepto es el mismo.

Ya escribí un post completo sobre cómo estructurar este archivo: CLAUDE.md: el system prompt de tu proyecto con Claude Code. Si no lo has leído, empieza por ahí.

2. Archivos de estado — lo que el modelo no puede inferir

El CLAUDE.md da el contexto estático: qué es el proyecto y cómo funciona. Pero los proyectos evolucionan. Necesitas capturar el estado dinámico.

Yo mantengo tres archivos en cada proyecto:

__INLINE_PLACEHOLDER_3__ — lista de tareas con estado (pendiente / en progreso / hecho). Una línea por tarea, fecha de última actualización. El modelo la lee y sabe exactamente dónde estás.

__INLINE_PLACEHOLDER_4__ — log de decisiones arquitectónicas. Cada decisión con su fecha, la opción elegida y el motivo por el que se descartó la alternativa. Este archivo vale oro cuando vuelves a un proyecto tres semanas después.

__INLINE_PLACEHOLDER_5__ — snapshot de la arquitectura actual. No el diagrama ideal. El diagrama real, con los módulos que existen ahora mismo. El modelo lo usa para no proponer soluciones que contradigan lo ya construido.

Tres archivos. Ninguno supera las dos páginas. Pero juntos eliminan el 80% de la inconsistencia.

3. Chunking de tareas — no pidas todo en un prompt

Este error lo cometo yo también cuando tengo prisa.

“Implementa el sistema de autenticación completo con JWT, refresh tokens, roles y middleware de autorización.”

El modelo lo intenta. Genera código. Pero es código que asume cosas sobre tu proyecto que no conoce, o que contradice la arquitectura que ya tienes. Y cuando algo falla, el problema está distribuido en 400 líneas de código que no entiendes del todo.

La regla que aplico: una tarea por sesión, una función por tarea.

En lugar de pedir la autenticación completa, pido:

Primero: el módulo de usuarios con su schema y validaciones
Luego: la generación de JWT con los claims que necesito
Luego: el endpoint de login que conecta ambos
Luego: el middleware que verifica el token

Cuatro sesiones. Cuatro archivos de contexto actualizados al final de cada una. Un sistema que entiendo porque lo construí pieza a pieza.

El modelo produce mejor código cuando el scope es pequeño y el contexto es preciso. En la práctica, siempre.

4. Resúmenes de sesión — el handoff entre el tú de hoy y el tú de mañana

Al final de cada sesión de trabajo, antes de cerrar, escribo este prompt:

“Resume lo que hemos hecho en esta sesión en 5-7 puntos: qué se implementó, qué decisiones se tomaron, qué problemas encontramos y qué queda pendiente para la siguiente.”

Copio esa respuesta en un archivo __INLINE_PLACEHOLDER_6__ con la fecha.

Cuando vuelvo al proyecto al día siguiente, la primera cosa que hago es darle ese log al modelo junto con el CLAUDE.md. El modelo arranca con el contexto exacto de donde lo dejé. Sin tener que re-explicar. Sin inconsistencias.

Diez minutos al final de cada sesión que ahorran una hora al principio de la siguiente.

Ejemplo práctico: un proyecto de tres semanas sin perder el hilo

Semana 1 — Cimentar el contexto

Antes de escribir una línea de código, genero la spec del proyecto con Spec-Driven Development: visión, usuarios, funcionalidades, arquitectura. Ese documento se convierte en la base del CLAUDE.md.

Creo los tres archivos de estado vacíos: __INLINE_PLACEHOLDER_7__, __INLINE_PLACEHOLDER_8__, __INLINE_PLACEHOLDER_9__. El modelo los actualiza conforme avanzamos.

Semana 2 — Construcción en chunks

Cada sesión tiene una tarea concreta de __INLINE_PLACEHOLDER_10__. Arranca con el CLAUDE.md, el archivo de arquitectura y el log de la sesión anterior. Termina con el modelo actualizando el estado de la tarea y generando el resumen de sesión.

Semana 3 — Cuando todo se complica

En la semana 3 es cuando los proyectos sin sistema se rompen. El código empieza a contradecirse. Las decisiones del día 1 ya nadie las recuerda. Las nuevas funcionalidades no encajan con lo que ya existe.

Con context engineering, la semana 3 es igual de fluida que la semana 1. Porque el modelo tiene, en cada sesión, el mismo nivel de contexto que tenías tú el primer día. El __INLINE_PLACEHOLDER_11__ le dice por qué tomaste las decisiones que tomaste. El __INLINE_PLACEHOLDER_12__ le muestra la estructura real. El log de sesión le dice dónde lo dejaste.

No es magia. Es sistema.

Lo que cambia cuando aplicas esto

La diferencia no es velocidad. Es consistencia.

Un developer sin context engineering puede ir rápido la primera semana. Pero en la semana 3, la deuda de contexto empieza a pasarle factura. Cada sesión nueva cuesta más porque hay que re-explicar más. Cada funcionalidad nueva tiene más probabilidad de romperse con algo anterior.

Un developer con context engineering mantiene el mismo ritmo en la semana 8 que en la semana 1. Porque el contexto no es algo que se pierde — es algo que se gestiona.

Esta es exactamente la mentalidad que enseño en el curso Construye con IA: de la idea al producto con Claude Code. No “cómo usar Claude”. Cómo construir con sistema.

FAQ

¿El context engineering solo funciona con Claude Code?

No. Los principios aplican a cualquier LLM y cualquier herramienta — Cursor, Windsurf, ChatGPT, Gemini. El CLAUDE.md tiene su equivalente en cada entorno: __INLINE_PLACEHOLDER_13__, __INLINE_PLACEHOLDER_14__, un system prompt inicial. La técnica de chunking y los resúmenes de sesión son agnósticos al modelo.

¿Cuánto tiempo añade a mi flujo de trabajo?

En la práctica, entre 10 y 20 minutos al día. Cinco minutos actualizando el __INLINE_PLACEHOLDER_15__, diez minutos pidiendo y guardando el resumen de sesión. El retorno es que ahorras una o dos horas semanales de re-explicar contexto y corregir inconsistencias. La matemática es clara.

¿Necesito crear estos archivos manualmente desde cero?

Puedes empezar con plantillas. En el curso Construye con IA incluyo las plantillas exactas de CLAUDE.md, __INLINE_PLACEHOLDER_16__ y __INLINE_PLACEHOLDER_17__ que uso en mis proyectos reales. Y si quieres la metodología de especificación completa, el libro SDD cubre el proceso de principio a fin.

¿Context engineering resuelve el problema de la ventana de contexto?

Parcialmente. No puedes ampliar la ventana de contexto del modelo — eso lo determina el proveedor. Lo que puedes hacer es gestionar qué información entra en esa ventana en cada sesión. Context engineering te da control sobre eso: qué es esencial que el modelo sepa, qué puede inferir y qué no necesita en ese momento concreto. No elimina la limitación. La hace manejable.

¿Cuál es la diferencia entre context engineering y RAG?

RAG (Retrieval-Augmented Generation) es una arquitectura técnica para recuperar información de fuentes externas y añadirla al contexto del modelo en tiempo de ejecución. Context engineering es una disciplina de trabajo que aplicas como developer para gestionar el contexto a lo largo de un proyecto. Son complementarios, no equivalentes. RAG es una herramienta. Context engineering es el sistema que decide qué información recuperar, cuándo y por qué.

Si quieres profundizar en cómo aplicar estas técnicas con proyectos reales y ver el flujo en acción, en Dominicode Labs tenemos sesiones prácticas donde trabajamos esto con proyectos concretos de la comunidad.

Por Bezael Pérez — Developer senior con más de 15 años de experiencia y fundador de Dominicode.

June 16, 2026

Product builder: el cambio de mentalidad que la IA hace posible

Hace tres años me llegó un mensaje de un developer con siete años de experiencia en React. Me decía:

“Bezael, sé hacer cualquier cosa que me pidan. Pero no tengo nada propio. Ni una app, ni un proyecto, ni un ingreso fuera de mi salario.”

Lo que describía no era un problema de habilidades técnicas. Era un problema de identidad.

Se veía a sí mismo como alguien que ejecuta. Alguien que recibe tickets, los cierra, y espera el siguiente. Un programador en el sentido más literal del término.

Y eso, en 2026, es el camino más directo a la irrelevancia.

Lo que ese developer necesitaba — lo que muchos developers necesitan — es pasar de ejecutar a construir: convertirse en un product builder.

El developer que ejecuta vs. el product builder que construye

Un product builder es un developer que combina criterio técnico con pensamiento de producto: no solo implementa soluciones, sino que decide qué problemas merecen ser resueltos y para quién.

Hay una diferencia fundamental entre los dos perfiles, y no tiene nada que ver con el nivel técnico.

Programador tradicional	Product builder
Pregunta: “¿Cómo lo implemento?”	Pregunta primero: “¿Debería implementarlo?”
Espera que alguien le diga qué construir	Tiene una tesis propia sobre qué problema merece ser resuelto
Mide su valor en líneas de código o tecnologías que domina	Mide su valor en si algo que construyó funciona para alguien real

No estoy diciendo que uno sea mejor persona que el otro. Estoy diciendo que el mercado está cambiando a una velocidad que hace que el primer perfil sea cada vez más reemplazable — y el segundo, más valioso que nunca.

Por qué ahora es el momento exacto para hacer este cambio

La barrera técnica para construir un producto ha colapsado.

Antes, si querías lanzar algo solo, necesitabas dominar frontend, backend, base de datos, autenticación, despliegue, y probablemente seis frameworks distintos. Necesitabas un equipo o años de práctica en cada capa.

Hoy, con herramientas como Claude Code, un developer con criterio puede tener un MVP funcionando en días. No porque la IA programe por ti — sino porque amplifica lo que ya sabes y elimina la fricción entre la idea y el código que la materializa.

Eso cambia la ecuación por completo. Ya no es técnica la limitante. Es saber qué construir, para quién, y por qué alguien pagaría por ello.

Eso es exactamente lo que trabajo en el curso Construye con IA: usar la IA no para generar código al azar, sino para ir de una idea real a un producto real con criterio de producto desde el principio.

Qué comportamientos concretos tiene un product builder

No voy a darte una lista de buzzwords. Te voy a decir cómo actúa alguien que ya hizo el cambio.

Empieza por el problema, no por la tecnología. Antes de elegir un stack, un product builder ya sabe a qué usuario le duele qué cosa. La tecnología es una consecuencia de la solución, no el punto de partida.

Shipea antes de que esté perfecto. El perfeccionismo técnico es el enemigo número uno de construir productos. Un product builder sabe que una versión imperfecta en manos de usuarios reales vale más que una versión perfecta en un repositorio privado.

Habla con usuarios. No con amigos que te dicen que tu idea es buena. Con personas que tienen el problema que quieres resolver. Y aprende a distinguir entre lo que dicen que quieren y lo que realmente usarían.

Entiende el negocio. No necesitas un MBA. Necesitas entender por qué alguien pagaría, cuánto pagaría, y cómo llegas a esa persona. Un product builder piensa en distribución desde el día uno.

Itera con datos. No con opiniones. Lanza, mide, ajusta. El ciclo es corto y deliberado.

Las cinco habilidades que nadie te enseñó en ningún bootcamp

1. Pensamiento de producto

No es saber usar Figma ni saber escribir user stories. Es desarrollar el hábito de preguntarte: “¿Qué problema real resuelve esto? ¿Para quién específicamente?”

Cuando ves una app que usas cada día, un product builder la desmonta mentalmente: qué decisiones tomaron, qué sacrificaron, por qué funciona.

2. Velocidad de validación

La idea de construir durante meses antes de mostrar algo a alguien es una trampa. El objetivo no es construir — es aprender lo antes posible si lo que estás construyendo tiene sentido.

Eso significa aprender a hacer prototipos rápidos y demos que generan feedback real. Una landing page que vende antes de que exista el producto ya es validación.

3. Escritura que convierte

Un product builder sabe explicar su producto en una frase. Sabe escribir una descripción que hace que alguien quiera probarlo. Sabe comunicar valor, no features.

Esta habilidad — que parece ajena al mundo técnico — es una de las más diferenciadoras.

4. Distribución y audiencia

El código más limpio del mundo no vale nada si nadie lo usa. Un product builder piensa desde el principio en cómo va a llegar a sus usuarios: SEO, comunidad, contenido, partnerships, cold outreach.

No tienes que hacerlo todo. Pero tienes que tener una respuesta a la pregunta: “¿Cómo van a enterarse de que esto existe?”

5. Tolerancia a la ambigüedad

Este es el más difícil para muchos developers, porque venimos de entornos donde los requisitos están (supuestamente) definidos. Construir un producto propio significa tomar decisiones con información incompleta, constantemente.

Aprender a avanzar sin certeza total es una habilidad que se entrena, no que se tiene o no se tiene.

El rol de la IA en todo esto

La IA no te convierte en product builder. Eso lo haces tú con las decisiones que tomas.

Lo que sí hace la IA es eliminar excusas.

Antes, “no tengo tiempo para construir algo propio porque el backend me llevaría meses” era una razón real. Hoy no lo es. Hoy puedes hacer el backend en días, el frontend en días, el despliegue en horas.

Lo que la IA no puede hacer por ti es decidir qué problema merece tu atención. No puede hablar con tus usuarios potenciales. No puede construir la audiencia que va a usar lo que hagas.

Esa es tu parte. Y es la parte que más importa.

Si quieres ver cómo trabajo este proceso — de la idea al producto con criterio de ingeniería y de negocio — en Dominicode Labs tenemos proyectos reales donde aplicamos exactamente esto: spec, validación, shipping, iteración.

Cómo empezar el cambio hoy (sin abandonar tu trabajo)

No te estoy pidiendo que renuncies ni que lances una startup la semana que viene. Te estoy pidiendo algo mucho más concreto.

Elige un problema que tengas tú mismo — algo que te frustra como developer, como usuario, como persona — y pasa dos semanas construyendo una solución mínima. No perfecta. Mínima.

Compártela con cinco personas que tengan el mismo problema. Observa qué pasa.

Eso es un ciclo completo de product builder. Y lo puedes hacer este mes.

La metodología que uso para estructurar este proceso — desde la especificación hasta el producto funcionando — está documentada en el Libro SDD. No es solo para proyectos grandes: es para cualquier developer que quiera pasar de “tengo una idea” a “tengo algo que funciona y que alguien usa”.

El cambio no es técnico. Es de identidad.

Volviendo al developer que me escribió hace tres años.

Le dije algo simple: deja de pensar en qué tecnologías sabes y empieza a pensar en qué problema puedes resolver para alguien esta semana.

No le dije que aprendiera product management. No le dije que hiciera un curso de negocios. Le dije que eligiera un problema pequeño y real, y que construyera algo — no para su portfolio, sino para alguien que lo necesita.

Hoy tiene un producto SaaS que le genera ingresos recurrentes, lo sigue manteniendo como side project, y lleva ocho meses sin depender de que alguien le diga qué ticket hacer.

Eso es lo que significa ser un product builder. No es un título. Es una forma de relacionarte con lo que construyes.

Y la IA ha puesto esa posibilidad al alcance de cualquier developer que decida tomarla.

Preguntas frecuentes

¿Un product builder necesita saber de diseño?
No necesitas ser diseñador. Sí necesitas entender los principios básicos de UX y tener criterio para cuando algo es demasiado confuso para un usuario. Herramientas como Figma o incluso componentes UI prefabricados resuelven la mayor parte del problema visual. Lo que no puede resolver una herramienta es saber si tu producto tiene sentido.

¿Se puede ser product builder trabajando para una empresa?
Sí, y de hecho es uno de los perfiles más buscados en empresas de producto. La diferencia es que aplicas el pensamiento de producto dentro de un equipo: cuestionas los requisitos, propones soluciones, mides el impacto real de lo que construyes. No eres el que ejecuta tickets — eres el que ayuda a decidir qué tickets merece la pena hacer.

¿La IA reemplaza al product builder?
La IA reemplaza al developer que ejecuta tareas sin criterio. Al product builder lo amplifica, porque puede construir más rápido y experimentar más sin necesitar un equipo grande. La IA toma decisiones técnicas; el product builder toma decisiones de producto. Son funciones distintas.

¿Por dónde empiezo si nunca he lanzado nada propio?
Empieza por un problema que conozcas bien — preferiblemente uno que tú mismo tengas. Construye la versión más pequeña posible que lo resuelva. Compártela con gente real antes de que esté “lista”. El error más común es esperar a tenerlo perfecto antes de mostrárselo a alguien. La retroalimentación temprana es lo que convierte una idea en un producto.

¿Cuánto tiempo lleva la transición de programador a product builder?
No es una transición con fecha de fin — es un cambio de mentalidad que se profundiza con cada proyecto. El primer ciclo completo (idea, construcción mínima, usuarios reales, iteración) ya te cambia cómo ves el trabajo. La mayoría de developers que conozco que hicieron el cambio notan la diferencia después del primer proyecto propio que alguien usa de verdad.

Por Bezael Pérez — Developer senior con más de 15 años de experiencia y fundador de Dominicode.

June 11, 2026

Agentic loop: el mecanismo detrás de los agentes de IA
La primera vez que vi a Claude Code refactorizar un módulo entero de TypeScript por sí solo, pensé que estaba viendo magia.

Abrió el archivo. Leyó el código. Identificó el problema. Buscó dependencias en otros archivos. Editó tres ficheros en orden. Ejecutó los tests. Vio que uno fallaba. Corrigió el error. Volvió a ejecutar. Verde. Listo.

Todo eso sin que yo le dijera qué hacer en cada paso. Le di un objetivo y él resolvió el camino.

Lo que estaba viendo no era magia. Era el agentic loop en funcionamiento — el mecanismo que convierte un LLM pasivo en un agente que percibe, decide y actúa de forma continua hasta completar una tarea. Si estás construyendo con IA en 2026, entender cómo funciona este bucle es tan importante como entender cómo funciona el event loop de Node.

Soy Bezael Pérez, developer senior y fundador de Dominicode. Llevo más de 15 años trabajando con software y los últimos dos obsesionado con cómo los agentes de IA cambian la forma de construir productos.

La diferencia que cambia todo: LLM vs. agente

Un LLM por sí solo es una función de texto: le das un input, devuelve un output. Extraordinariamente potente, pero estático. No sabe qué pasó antes. No puede hacer nada en el mundo real. No puede corregirse si se equivoca. Recibe. Responde. Se detiene.

Un agente es diferente en una sola dimensión — pero esa dimensión lo cambia todo: puede actuar sobre su entorno y observar las consecuencias.

Cuando le preguntas a ChatGPT “¿cómo conecto a PostgreSQL desde TypeScript?”, eso es un LLM. Te da la respuesta. Te toca a ti ejecutarla, ver si funciona, corregirla si falla.

Cuando Claude Code abre tu proyecto, lee los archivos, escribe el código, ejecuta los tests y corrige los errores — eso es un agente con agentic loop. La diferencia no está en el modelo. Está en el bucle.

Las fases del agentic loop

El agentic loop no es un concepto abstracto. Es una arquitectura de ejecución con fases concretas que se repiten hasta que el agente completa su objetivo o se queda sin herramientas para avanzar. Este patrón lo formalizaron Yao et al. en el paper ReAct: Synergizing Reasoning and Acting in Language Models (2022) y es hoy la base de la mayoría de frameworks de agentes.

Fase 1: Percibir

El agente recibe información del entorno. Puede ser el mensaje del usuario, el resultado de una herramienta ejecutada en el ciclo anterior, el contenido de un archivo, una respuesta HTTP, el output de un comando de terminal.

Esta fase parece trivial. No lo es. La calidad de lo que el agente percibe determina la calidad de lo que decide a continuación. Un agente que lee mal el contexto toma decisiones incorrectas con total confianza — y eso en producción es mucho más peligroso que un error que falla de forma evidente.

Este fragmento muestra qué recibe el agente al inicio de cada ciclo: el mensaje del usuario, los resultados de herramientas anteriores y el system prompt que define sus capacidades:
```
// Lo que el agente "percibe" en cada ciclo
const context = {
  userMessage: "Refactoriza el módulo de autenticación para usar Signals",
  previousToolResults: [
    {
      tool: "read_file",
      output: "// auth.service.ts\nimport { Injectable } from '@angular/core'..."
    }
  ],
  systemPrompt: "Eres un assistant que refactoriza código Angular. Tienes acceso a las herramientas: read_file, write_file, execute_command."
};
```
Fase 2: Razonar

El LLM procesa el contexto acumulado y decide qué hacer a continuación. Esta es la fase donde el modelo aplica su capacidad de razonamiento: evalúa el estado actual, compara con el objetivo, identifica el próximo paso.

En modelos modernos como Claude Sonnet o GPT-4o, esta fase incluye razonamiento encadenado — el modelo se habla a sí mismo internamente antes de producir una decisión. En Claude, Anthropic expone este razonamiento explícitamente como “extended thinking” en la respuesta de la API — una feature específica de su plataforma, no un estándar cross-API.

Lo que el agente produce en esta fase no es una respuesta de texto. Es una decisión estructurada: qué herramienta usar, con qué argumentos, por qué.

En lugar de texto libre, el razonamiento del agente produce una llamada estructurada a herramienta. Este pseudocódigo representa esa decisión (el campo thinking es razonamiento interno del modelo — no lo recibes como developer en la respuesta de la API):
```
// pseudocódigo — thinking es interno al modelo, no un campo de la API
const agentDecision = {
  thinking: "Necesito leer el archivo auth.service.ts antes de modificarlo",
  toolCall: {
    name: "read_file",
    arguments: {
      path: "src/app/auth/auth.service.ts"
    }
  }
};
```
Fase 3: Actuar

El agente ejecuta la herramienta que decidió usar. Aquí es donde la IA toca el mundo real: escribe en disco, llama a una API externa, ejecuta SQL, navega una página web, envía un email.

Esta es también la fase más delicada desde el punto de vista de seguridad y control. Una acción ejecutada no se puede deshacer fácilmente. Por eso los sistemas de agentes bien diseñados implementan sandboxes, confirmaciones humanas para acciones irreversibles y límites explícitos en qué herramientas puede usar el agente.

La función executeToolCall implementa esta capa de ejecución: recibe la decisión estructurada del agente y ejecuta la acción real sobre el sistema:
```
// Ejecución de la herramienta — el agente actúa sobre el entorno
async function executeToolCall(toolCall: ToolCall): Promise<ToolResult> {
  switch (toolCall.name) {
    case "read_file":
      return { output: await fs.readFile(toolCall.arguments.path, "utf-8") };
    case "write_file":
      await fs.writeFile(toolCall.arguments.path, toolCall.arguments.content);
      return { output: "Archivo escrito correctamente" };
    case "execute_command":
      const result = await exec(toolCall.arguments.command);
      return { output: result.stdout, error: result.stderr };
    default:
      throw new Error(Herramienta desconocida: ${toolCall.name});
  }
}
```
Fase 4: Observar

El agente recibe el resultado de la acción ejecutada y lo incorpora a su contexto. Si leyó un archivo, ahora tiene el contenido. Si ejecutó un test, ahora sabe si pasó o falló. Si llamó a una API, tiene la respuesta — o el error.

Esta fase cierra el bucle. El resultado de la observación se convierte en nuevo input para la siguiente iteración de Percibir → Razonar → Actuar. El agente actualiza su modelo interno del estado del mundo y decide si ha completado su objetivo o si necesita otro ciclo.

El resultado de la herramienta vuelve al contexto como un mensaje más. El modelo evalúa si ha terminado o si necesita otra herramienta:
```
// El resultado se incorpora al contexto para el siguiente ciclo
messages.push({
  role: "tool",
  content: toolResult.output,
  toolCallId: toolCall.id
});

// ¿Ha completado el objetivo? El modelo decide. const nextStep = await llm.complete(messages); // Si devuelve texto sin tool_call → tarea completada // Si devuelve otro tool_call → el bucle continúa
```
Repetir (o detenerse)

El bucle continúa mientras el agente tenga herramientas que ejecutar y no haya alcanzado su objetivo. Se detiene cuando el modelo produce una respuesta de texto sin invocar ninguna herramienta — lo que indica que considera la tarea completada — o cuando alcanza el límite de iteraciones definido en la configuración.

Ese límite de iteraciones no es un detalle menor. Es una de las decisiones de diseño más importantes en un sistema agéntico. Un agente sin límite puede quedar atrapado en un bucle infinito consumiendo tokens y ejecutando acciones hasta que alguien apague el proceso.

Cómo lo implementan las herramientas reales

No tienes que construir el agentic loop desde cero. Las herramientas que ya existen lo implementan por ti, con tres aproximaciones distintas: ejecución local directa (Claude Code), orquestación de grafos (LangGraph) y no-code visual (n8n). Cada una optimiza para un perfil diferente de developer y caso de uso.
- Claude Code — Loop completo con herramientas del sistema operativo: leer/escribir archivos, ejecutar comandos de terminal, buscar en el codebase. El agente decide autónomamente qué pasos dar y puedes verlo trabajar en tiempo real en la terminal.
- LangChain / LangGraph — Loop como grafo de nodos configurables. Tú defines las transiciones, condiciones de parada y herramientas. Más control y flexibilidad para flujos con ramificaciones complejas.
- n8n — AI Agent nodes que envuelven el loop en un flujo visual. Ideal para automatizaciones de negocio con APIs externas, webhooks y transformaciones de datos sin escribir código.
- AutoGPT / BabyAGI — La primera ola de agentes. Implementaron el loop de forma casi literal: generaban sus propias subtareas, las priorizaban y las ejecutaban. Funcionaban en demos, fallaban en producción por acumulación de errores en cada ciclo y falta de controles.
Si quieres profundizar en cómo construir el harness que envuelve el loop, este análisis sobre harness engineering con agentes de IA cubre la capa de orquestación en detalle.

Por qué los agentes fallan — y no es culpa del modelo

El agentic loop tiene un problema estructural que los developers aprenden a la fuerza: los errores se propagan y se amplifican.

En un LLM normal, si el modelo alucina en la respuesta, el usuario lo ve y puede corregirlo. En un agente con agentic loop, si el modelo toma una decisión incorrecta en el ciclo 2, esa decisión puede contaminar los ciclos 3, 4 y 5 antes de que nadie se dé cuenta. Para cuando el agente termina, puede haber modificado archivos, llamado a APIs y tomado decisiones basadas en una premisa incorrecta del principio.

Hay tres patrones de fallo que aparecen una y otra vez en producción:

Context drift — El contexto acumulado crece ciclo a ciclo. En conversaciones largas, el modelo empieza a perder el hilo de los objetivos originales y se centra en los últimos resultados. El agente puede alcanzar un estado donde “funciona” localmente pero ha perdido el objetivo global.

Tool loop — El agente entra en un ciclo donde ejecuta la misma herramienta con los mismos argumentos repetidamente porque no sabe cómo interpretar el resultado. Sin un límite de iteraciones y sin detección de patrones repetitivos, consume tokens hasta el límite de la sesión.

Overconfidence — El modelo decide con alta confianza en casos donde debería pedir confirmación. Elimina un archivo que creía temporal. Envía un email que debía ser un borrador. Ejecuta una migración de base de datos en producción. La confianza del modelo no tiene correlación con la corrección de la acción.

La solución no es usar un modelo más inteligente. Es diseñar el sistema con los controles correctos: límites de iteración, human-in-the-loop para acciones irreversibles, y observabilidad para saber exactamente qué está haciendo el agente en cada ciclo. Si te interesa la parte de observabilidad, en el post sobre observabilidad en LLMs: traza, mide y depura tus agentes cubrimos cómo instrumentar el loop con trazas y métricas reales.

Cuándo usar el agentic loop (y cuándo no)

El agentic loop resuelve una clase específica de problemas. Usarlo para todo es uno de los errores más comunes que veo en equipos que empiezan con IA.

Úsalo cuando:
- La tarea requiere múltiples pasos que dependen del resultado de los anteriores
- El objetivo está claro pero el camino para alcanzarlo no se puede definir de antemano
- Necesitas interactuar con herramientas externas en función del contexto
- La tarea implica explorar un espacio de posibilidades (búsqueda, refactorización, análisis)
Ejemplos concretos: refactorizar un módulo de código, investigar un bug leyendo múltiples archivos, rellenar formularios complejos a partir de documentos, ejecutar una pipeline de procesamiento de datos donde cada paso depende del anterior.

No lo uses cuando:
- Puedes resolver el problema con un solo prompt bien diseñado
- La latencia importa y el usuario está esperando una respuesta inmediata
- Las acciones son irreversibles y el contexto no garantiza que el agente tomará la decisión correcta
- El problema tiene una solución determinista que no requiere razonamiento iterativo
Un agente que escribe el texto de un email de bienvenida es sobre-ingeniería. Un LLM con el prompt correcto lo hace en un ciclo, sin herramientas, en 200ms. Reserva el agentic loop para los problemas que lo necesitan de verdad.

En el curso Construye con IA abordamos exactamente este criterio de decisión: qué arquitectura elegir para cada problema, cuándo un agente añade valor real y cuándo un prompt bien diseñado es más efectivo, rápido y barato.

El agentic loop en 2026: dónde está el límite real

El límite ya no es la capacidad del modelo. Los LLMs actuales razonan lo suficientemente bien como para completar tareas complejas de múltiples pasos.

El límite es la confianza que puedes depositar en el sistema.

Confiar en que el agente tomará la decisión correcta en cada ciclo, sin supervisión humana, es una apuesta que depende del dominio, del riesgo de las acciones y de la calidad de las herramientas que le has dado. En tareas de desarrollo donde los cambios son reversibles (código en un repositorio con git), puedes darle mucha autonomía. En tareas que afectan a clientes o datos de producción, el loop necesita checkpoints humanos.

El patrón que están adoptando los equipos más avanzados es human-in-the-loop selectivo: el agente actúa de forma autónoma en la mayoría de ciclos, pero solicita confirmación explícita antes de ejecutar acciones que superen un umbral de riesgo definido en el sistema.

No es rendirse al agente ni microgestionar cada paso. Es diseño de sistema con criterio.

Si quieres ver cómo aplico este patrón en proyectos reales — y explorar los proyectos que la comunidad está construyendo con agentes en producción — pásate por Dominicode Labs. Hay recursos, proyectos y discusiones que no publicaré en el blog.

FAQ — Preguntas frecuentes sobre el agentic loop

¿Qué diferencia hay entre un chatbot y un agente con agentic loop?

Un chatbot procesa mensajes y genera respuestas de texto. No ejecuta acciones en el mundo real ni mantiene un estado entre ciclos más allá del historial de conversación. Un agente con agentic loop puede leer archivos, llamar a APIs, ejecutar código y tomar decisiones basadas en los resultados de esas acciones — repitiendo el ciclo hasta completar un objetivo complejo.

¿El agentic loop necesita un modelo específico o funciona con cualquier LLM?

Técnicamente funciona con cualquier LLM que soporte function calling o tool use. En la práctica, la calidad del loop depende mucho de la capacidad del modelo para razonar sobre los resultados de las herramientas y decidir el siguiente paso correcto. Claude Sonnet, GPT-4o y Gemini 2.5 Pro son los modelos que ofrecen resultados más consistentes hoy. Modelos más pequeños fallan con más frecuencia en las fases de razonamiento y en la detección de cuándo el objetivo está completo.

¿Cuántas iteraciones puede hacer un agente antes de fallar o perder el hilo?

Depende del modelo y del tamaño del contexto. Los modelos actuales con ventanas de contexto grandes (200k tokens en Claude) pueden mantener coherencia durante decenas de iteraciones en tareas bien definidas. En la práctica, la degradación empieza a notarse alrededor de las 20-30 iteraciones en tareas complejas con mucho contexto acumulado. Un buen sistema define un maxIterations entre 10 y 50 según el dominio, con lógica de parada anticipada si detecta patrones repetitivos.

¿Claude Code usa un agentic loop?

Sí. Claude Code implementa el agentic loop completo: lee el contexto del proyecto, decide qué herramientas usar (leer archivos, escribir código, ejecutar comandos), observa los resultados y repite hasta completar la tarea. La diferencia con un uso básico de la API de Claude es que Claude Code orquesta este bucle de forma transparente, con acceso al filesystem y al terminal, y con la capacidad de autocorregirse cuando un test falla o un comando devuelve un error.

¿Es el agentic loop lo mismo que el “chain of thought”?

No. Chain of thought es una técnica de prompting donde el modelo razona paso a paso antes de dar una respuesta — todo ocurre dentro de una sola llamada al LLM. El agentic loop es una arquitectura de ejecución que implica múltiples llamadas al modelo, ejecución real de herramientas entre llamadas, y un estado que se actualiza en cada ciclo. Chain of thought puede ser parte de la fase de razonamiento dentro del loop, pero son conceptos de nivel diferente.

Por Bezael Pérez — Developer senior con más de 15 años de experiencia y fundador de Dominicode.

Si este post te ha sido útil, hay más contenido técnico sobre IA aplicada al desarrollo en el canal de YouTube de Dominicode.
June 10, 2026

Novedades de Angular v22: todo lo que cambia en esta versión

Un compañero me preguntó la semana pasada: “¿Merece la pena actualizar ya a Angular v22?”.

Le respondí lo mismo que le diría a ti: las novedades de Angular v22 no son parches ni renombrados. Son APIs nuevas que reemplazan patrones que llevan años instalados en nuestra cabeza — y varias de ellas pasan a ser estables en esta versión. Si llevas tiempo esperando que Angular se parezca a lo que promete ser, v22 es esa versión.

Afecta cómo gestionas estado asíncrono, cómo escribes formularios, cómo arranca la detección de cambios y cómo declaras componentes. Todo a la vez. En una sola versión.

Este post es el mapa. Si quieres ir al detalle de alguna feature concreta, tienes posts específicos linkados donde corresponde.

¿Qué es Angular v22? Angular v22 es la versión que consolida las Signal APIs como estándar principal del framework. Introduce la Resource API estable (resource(), rxResource()), el nuevo decorator @Service(), Signal Forms experimental, y avanza en zoneless como camino recomendado para proyectos nuevos. Es la versión con más cambios de fondo desde que Angular adoptó standalone components.

Qué cambia de raíz en Angular v22

Antes de ver las APIs una a una, hay una idea central que explica casi todo lo que trae v22:

Angular se está moviendo hacia un modelo completamente basado en Signals, sin Zones y sin boilerplate innecesario.

Eso no es nuevo como dirección. Lo que es nuevo en v22 es que varias piezas de ese puzzle pasan a ser estables o por lo menos usables en producción experimental. Ya no es solo teoría.

Patrón anterior vs equivalente en Angular v22

Patrón anterior

Equivalente en Angular v22

`HttpClient.get().subscribe()`	`httpResource()` (experimental)
`Subject + switchMap`	`resource()` / `rxResource()` (estables)
`new FormControl()`	Signal Forms `formField()` (experimental)
`@Injectable({ providedIn: 'root' })`	`@Service()` (estable)
`ChangeDetectionStrategy.Default`	`ChangeDetectionStrategy.Eager`
`standalone: true` explícito	Default desde v22 — ya no hace falta
`allowSignalWrites: true` en effect	Eliminado — ya no necesario

Resource API en Angular v22: gestión de estado asíncrono sin subscribe

La novedad más importante de Angular v22 en el día a día son las tres APIs de Resource. resource() y rxResource() pasan a ser estables:

`resource()` — async state sin subscribe

resource() es la forma nativa de Angular para manejar operaciones asíncronas reactivas. Defines un loader con una Promise y el framework gestiona loading, error y datos por ti.

import { resource, signal } from '@angular/core';
@Component({ ... })
export class ProductListComponent {
categoryId = signal(1);
products = resource({
request: () => this.categoryId(),
loader: ({ request }) =>
fetch(/api/products?category=${request}).then(r => r.json())
});
}

En el template:

@if (products.status() === 'loading') {
<p>Cargando...</p>
}
@if (products.status() === 'resolved') {
@for (product of products.value(); track product.id) {
<li>{{ product.name }}</li>
}
}

Los estados posibles son strings literales: 'idle', 'loading', 'reloading', 'resolved', 'error', 'local'. No hay enum. No uses ResourceStatus.Loading — no existe así.

`rxResource()` — cuando el backend habla en Observables

Si tienes servicios que devuelven Observables (la mayoría de los proyectos reales), usa rxResource(). La clave es que el parámetro se llama stream, no loader:

import { rxResource } from '@angular/core/rxjs-interop';
@Component({ ... })
export class OrdersComponent {
userId = signal(42);
orders = rxResource({
request: () => this.userId(),
stream: ({ request }) => this.ordersService.getByUser(request)
});
}

La diferencia con resource() es solo el parámetro: loader para Promises, stream para Observables. El resto del comportamiento es idéntico.

`httpResource()` — HTTP reactivo sin `HttpClient.get().pipe(...)`

httpResource() es la versión experimental especializada en HTTP — úsala con precaución en producción. El primer argumento siempre es una función, nunca un string directo.

import { httpResource } from '@angular/core';
@Component({ ... })
export class UserProfileComponent {
userId = signal(1);
user = httpResource<User>(() => /api/users/${this.userId()});
}

Requiere provideHttpClient() en tu configuración. Devuelve un HttpResourceRef que expone .value(), .status(), .statusCode() y .headers() como signals.

Si quieres profundidad en las tres APIs, tengo un post dedicado: Resource API en Angular 22: el fin del subscribe() manual.

`linkedSignal()` estable: el signal derivado que puedes escribir

linkedSignal() resuelve un problema concreto que no tenía solución limpia hasta ahora: quieres un signal que se inicialice (y se resetee) a partir de otro signal, pero que también puedas modificar manualmente.

Ejemplo clásico: una lista de items y un item seleccionado que vuelve al primero cuando cambia la lista.

import { signal, linkedSignal } from '@angular/core';
@Component({ ... })
export class ItemSelectorComponent {
items = signal(['Angular', 'React', 'Vue']);
selectedItem = linkedSignal(() => this.items()[0]);
}

Cuando items cambia, selectedItem vuelve automáticamente al primer elemento. Pero puedes escribir en selectedItem en cualquier momento:

this.selectedItem.set('React'); // funciona

Con un computed() no puedes hacer eso. Con un signal() normal perderías el vínculo con items. linkedSignal() es la pieza que faltaba entre los dos.

`debounced()` experimental: búsquedas sin setTimeout manual

debounced() es una API experimental de Angular v22 para manejar valores con delay configurable. No devuelve un Signal — devuelve un Resource, así que se lee con .value() y .status(), igual que resource().

Es ideal para barras de búsqueda donde no quieres disparar una petición por cada tecla. Al ser experimental, la firma exacta puede cambiar antes de estabilizarse — consulta siempre la documentación oficial de angular.dev antes de usarla en producción.

Signal Forms experimental: formularios basados en Signals

Angular v22 introduce Signal Forms como API experimental. No reemplaza a Reactive Forms todavía — no está pensado para producción sin asumir el riesgo de breaking changes — pero marca la dirección clara hacia la que van los formularios en Angular.

La premisa es eliminar el FormBuilder, los FormGroup y los valueChanges basados en Observables. Todo como signals.

Es la feature que más puede cambiar antes de estabilizarse, así que úsala con precaución en proyectos reales y estate pendiente a las release notes.

`effect()` ya no necesita `allowSignalWrites`

Pequeño pero importante: a partir de v22, escribir en un signal dentro de un effect() está permitido por defecto. La opción allowSignalWrites está deprecada y no debes usarla.

Antes (v21 y anteriores):

// v21 — necesitabas esto:
effect(() => {
this.count.set(this.source() * 2);
}, { allowSignalWrites: true });

Ahora (v22):

// v22 — simplemente funciona:
effect(() => {
this.count.set(this.source() * 2);
});

Si tienes código con allowSignalWrites: true, no se rompe todavía. Pero el compilador te avisará que está deprecated. Es uno de esos cambios que limpias en 10 minutos con un find & replace.

`ChangeDetectionStrategy.Eager` y el adiós definitivo a `Default`

Angular v22 introduce ChangeDetectionStrategy.Eager como el nuevo nombre para la estrategia de detección de cambios que antes se llamaba Default.

ChangeDetectionStrategy.Default pasa a ser un alias deprecated de Eager. Si tienes componentes sin estrategia explícita, no se rompen, pero la nomenclatura oficial cambia:

// Antes (sigue funcionando, pero deprecated el nombre):
@Component({
changeDetection: ChangeDetectionStrategy.Default
})
// Ahora (lo correcto en v22):
@Component({
changeDetection: ChangeDetectionStrategy.Eager
})

En la práctica, para componentes nuevos lo relevante sigue siendo usar OnPush cuando sea posible y avanzar hacia zoneless. Eager es el fallback explícito cuando necesitas el comportamiento clásico por nombre, no por omisión.

Zoneless en Angular v22: cómo funciona y cuándo usarlo en producción

Zone.js ha sido la pieza más criticada del runtime de Angular desde que existe. En v22 el modo zoneless avanza significativamente como alternativa estable para proyectos nuevos.

Sin Zone.js, Angular solo ejecuta detección de cambios cuando se lo dices explícitamente: a través de signals, events, o marcando el componente como sucio manualmente. El resultado son aplicaciones más predecibles, más fáciles de depurar y más rápidas en la mayoría de los escenarios.

Para activarlo en una app nueva:

// main.ts
bootstrapApplication(AppComponent, {
providers: [
provideExperimentalZonelessChangeDetection()
]
});

En el Curso de Angular Moderno cubrimos la arquitectura zoneless con Signals desde cero — actualizado a v22.

`standalone: true` ya no es necesario

A partir de v22, standalone es el default. No necesitas escribir standalone: true en ningún componente nuevo:

// v21 y anteriores — necesitabas declararlo:
@Component({
standalone: true,
selector: 'app-product-card',
...
})
// v22 — standalone por defecto, sin declaración:
@Component({
selector: 'app-product-card',
...
})

Solo necesitas standalone: false si quieres un componente que NO sea standalone — que es el caso raro ahora.

Nuevo decorator `@Service()` en Angular v22: para qué sirve

Si llevas tiempo usando inject() en lugar de constructor injection, este cambio te va a gustar.

Angular v22 introduce @Service() como alternativa directa a @Injectable({ providedIn: 'root' }). Sin opciones, sin configuración — declaras la clase como servicio y Angular la provee en root automáticamente.

// Antes
@Injectable({ providedIn: 'root' })
export class AuthService {
private http = inject(HttpClient);
}
// Angular v22
@Service()
export class AuthService {
private http = inject(HttpClient);
}

Un detalle importante: @Service() solo funciona con inject(). Si intentas usar constructor injection con @Service(), obtendrás un error — el decorator asume el modelo de inyección funcional. Si necesitas constructor injection o configuración avanzada como providedIn: 'platform', sigue usando @Injectable.

Es coherente con la dirección que lleva el framework desde que inject() llegó — alejarse del constructor como único punto de entrada de dependencias.

Angular v22: tabla completa de features estables y experimentales

Feature

Estado en v22

Para producción

`resource()`	Estable	Sí
`rxResource()`	Estable	Sí
`linkedSignal()`	Estable	Sí
`@Service()`	Estable	Sí
`standalone: true` default	Estable	Sí
`allowSignalWrites` deprecated	Estable	Quitar el flag
`ChangeDetectionStrategy.Eager`	Estable	Sí
`httpResource()`	Experimental	Con precaución
`debounced()`	Experimental	Con precaución
Signal Forms	Experimental	No recomendado aún
Zoneless	Developer preview	Proyectos nuevos

Cómo migrar a Angular v22 desde Angular 20 o 21: guía paso a paso

No necesitas migrar todo a la vez. Esta es la secuencia que tiene más sentido:

Elimina allowSignalWrites: true de tus effects. Es trivial y lo haces en un PR.
Adopta linkedSignal() donde tengas signals que dependen de otros y se resetean. Los encontrarás fácilmente.
Migra a @Service() en servicios simples que ya usen inject(). La ganancia es inmediata en legibilidad.
Empieza a usar resource() en componentes nuevos en lugar de switchMap + HttpClient.get(). No tienes que migrar los existentes de golpe.
Experimenta con zoneless en un proyecto nuevo o en un módulo aislado.
Deja Signal Forms para más adelante hasta que estabilice.

Si quieres ir más al fondo en cómo funciona el testing de estos nuevos patrones, tengo el Curso de Testing en Angular actualizado con Jest y Testing Library — resource() y linkedSignal() cambian cómo se escriben los tests de componentes.

FAQ — Preguntas frecuentes sobre Angular v22

¿Es Angular v22 compatible con Angular v19 o v20?

La migración de v19/v20 a v22 es incremental. Las APIs nuevas son aditivas — no rompen el código existente. standalone: true sigue funcionando aunque ya no sea necesario. ChangeDetectionStrategy.Default sigue siendo un alias válido aunque deprecated. Puedes actualizar con ng update y adoptar las nuevas APIs a tu ritmo sin necesidad de reescribir nada de golpe.

¿httpResource() reemplaza a HttpClient en Angular v22?

No. HttpClient no desaparece en v22 y sigue siendo la opción recomendada para lógica HTTP compleja. httpResource() es una alternativa más ergonómica para casos concretos: cuando tienes un signal como parámetro reactivo de la petición y quieres gestionar loading/error automáticamente. Para interceptores custom, peticiones en paralelo o manejo avanzado de headers, HttpClient con RxJS sigue siendo la herramienta correcta. Además, httpResource() es experimental en v22, así que no es recomendable adoptarlo masivamente en proyectos en producción todavía.

¿Qué diferencia hay entre resource() y httpResource()?
resource() es genérico: acepta cualquier función que devuelva una Promise como loader. httpResource() está especializado en HTTP y usa internamente HttpClient, por lo que respeta interceptores, el provideHttpClient() configurado y expone metadatos de la respuesta como .statusCode() y .headers(). Para llamadas HTTP simples con parámetros reactivos, httpResource() es más cómodo. Para lógica asíncrona que no sea HTTP, resource() es la opción.
¿Signal Forms reemplaza a Reactive Forms en v22?

No. Signal Forms es experimental en v22 y no está pensado para reemplazar Reactive Forms todavía. Reactive Forms sigue siendo la opción estable y recomendada para formularios complejos en producción. Signal Forms marca la dirección futura del framework — formularios completamente basados en signals sin FormBuilder ni valueChanges — pero antes de considerarla lista para producción necesita que la API se estabilice, cosa que no ocurre en v22.

¿Puedo usar zoneless ya en producción con Angular v22?

Depende del proyecto. Para proyectos nuevos que uses signals de forma consistente, zoneless es viable — el equipo de Angular lo recomienda como el camino a seguir. Para proyectos existentes que mezclan Zone.js con código legacy que depende del ciclo de detección de cambios automático, la migración requiere más cuidado. En v22 el modo zoneless sigue marcado como “experimental” en el nombre del provider (provideExperimentalZonelessChangeDetection()), aunque en la práctica es bastante estable para proyectos nuevos bien estructurados.

¿linkedSignal() es lo mismo que computed() con posibilidad de escritura?

Conceptualmente se parecen, pero con una diferencia clave: linkedSignal() tiene dependencia reactiva sobre otro signal para su valor inicial y para resetearse automáticamente cuando ese signal cambia. computed() es de solo lectura — no puedes escribir en él. signal() es escribible pero no tiene vínculo reactivo con otros signals. linkedSignal() combina los dos comportamientos: se actualiza cuando cambia su fuente y también acepta escrituras manuales, lo que lo hace ideal para estados que tienen un “valor por defecto reactivo” pero que el usuario puede sobrescribir.

¿Para qué sirve @Service() y cuándo no usarlo?
@Service() es el nuevo decorator de Angular v22 que simplifica la declaración de servicios singleton en root. Equivale a @Injectable({ providedIn: 'root' }) pero sin configuración. Solo funciona con inject() — si intentas constructor injection con @Service(), obtendrás un error. Úsalo en servicios simples que ya sigan el patrón de inject(). Si necesitas providedIn: 'platform', providedIn: 'any' u otras opciones avanzadas, sigue usando @Injectable con su configuración completa.

Si estás construyendo con IA en tu día a día como developer, el curso Construye con IA te muestra cómo integrar Claude Code en tu flujo de trabajo real con proyectos Angular y TypeScript.

Por Bezael Pérez — Developer senior con más de 15 años de experiencia y fundador de Dominicode.

June 9, 2026

Cómo evitar que los agentes elijan mal sus herramientas en proyectos de IA
El problema real del tool_use: cuándo los agentes eligen mal sus herramientas

Tiempo estimado de lectura: 4 min
- Diseña cada tool como un contrato: propósito claro, condición binaria de activación, restricciones negadas y un schema de salida.
- Reduce la superficie de decisión: retrieval dinámico y máquinas de estado cuando el catálogo supera ~10–15 tools.
- Valida estrictamente: enums, formatos concretos y validación back-end (ej. Zod) para evitar argumentos corruptos.
- Mide lo que importa: precisión de selección, retries, tokens gastados y casos de misuse en staging.
Si tu agente tiene acceso a muchas herramientas y no defines reglas explícitas, no estás ante un fallo del modelo: estás ante un diseño roto. Este artículo explica por qué ocurren elecciones equivocadas y cómo diseñar descripciones de herramientas que reducen errores de selección hasta en ~80% en implementaciones reales. Conectar APIs es trivial; conseguir que un LLM seleccione la herramienta correcta, con argumentos válidos y sin invocar capacidades fuera de scope, es ingeniería.

Resumen rápido (lectores con prisa)

Define cada herramienta como un contrato: una frase de propósito, una condición de activación binaria, restricciones explícitas de uso y un schema de salida mínimo. Usa retrieval dinámico para reducir opciones y máquinas de estado para limitar permisos. Valida en back-end (ej. Zod) y mide precisión de selección y retries.

El problema real del tool_use: cuándo los agentes eligen mal sus herramientas — causas

Tres causas estructurales explican la mayoría de las fallas en producción:
1. Solapamiento semántico. Dos o más tools parecen válidas para la misma intención; el modelo elige por probabilidades.
2. Ausencia de fronteras negativas. Documentas qué hace la tool pero no cuándo está prohibida; el modelo probará usos peligrosos.
3. Sobrecarga del contexto. Inyectar 30–40 esquemas en el prompt produce “lost in the middle” y pérdida de atención (ver estudio).
Si no mitigues estas tres fuentes de ambigüedad, el agente duplicará llamadas, generará argumentos corruptos o intentará acciones destructivas.

Cómo diseñar descripciones que reducen errores de selección (estructura de 4 campos)

Piensa la descripción de cada herramienta como un contrato para una red neuronal: precisa, restrictiva y ejecutable. Sigue estos cuatro campos en todas las tools:
1. Propósito (What) — Una sola frase: acción exacta.
2. Condición de activación (When) — “Úsalo SOLO cuando…” (condición binary o claramente verificable).
3. Restricción excluyente (When NOT) — “NO lo uses para…” y alternativa sugerida.
4. Formato de salida (Expected Output) — JSON schema mínimo que el agente puede comprobar antes de llamar.
Ejemplo práctico

Descripción:

“Recupera el estado y el último comentario de un ticket de Jira. Úsalo SOLO con un ticket ID válido (PROJ-123). NO lo uses para búsquedas por texto; usa search_jira_tickets para eso.”

Schema (JSON / Zod-like)

{
“type”: “object”,
“properties”: {
“ticketId”: { “type”: “string”, “pattern”: “^[A-Z]+-\\d+$” }
},
“required”: [“ticketId”]
}

Ese nivel de precisión elimina ambigüedad en cuándo y cómo llamar la tool.

Schemas como enrutadores: reglas prácticas
- Evita tipos genéricos. Si esperas fecha, exige format: “date-time”.
- Describe cada propiedad. El LLM usará esa descripción para construir el valor.
- Forza enums para valores discretos. Los LLM respetan enums con alta consistencia.
- Implementa validación estricta (Zod) en el back-end y devuelve errores estructurados (Result pattern) si el LLM envía datos inválidos.
Arquitectura para catálogos grandes: Dynamic Tool Retrieval y State Machines

Cuando tienes >10–15 tools, las descripciones no bastan. Aplica dos patrones:
- Dynamic Tool Retrieval (RAG de herramientas). Embeddiza la intención del usuario y busca en una DB vectorial las 3–4 tools más relevantes; solo esas se inyectan en el prompt. Implementaciones prácticas usan pgvector o sistemas vectoriales gestionados. Reducir la superficie de decisión aumenta la precisión drásticamente.
- Máquinas de estado / orquestación. Divide responsabilidades entre sub-agentes con permisos limitados. Herramientas de orquestación: n8n, LangGraph o XState. El nodo de “consulta” solo expone tools de lectura; el nodo de “modificación” habilita herramientas de escritura tras condiciones de validación.
Restricción por estado = seguridad + predictibilidad.

Métricas y pruebas que importan

No te fíes de sensaciones. Mide:
- Precisión de selección (tool chosen vs. tool expected).
- Retries por tipo de error.
- Tokens gastados en reintentos inútiles.
- Casos de “tool misuse” detectados en staging.
Introduce tests que simulen entradas ambiguas y fallos de herramientas. Si una nueva tool aumenta la entropía del sistema, el pipeline debe bloquear el cambio hasta ajustar descripciones/schemas o introducir retrieval/state gating.

Conclusión operativa

El problema real del tool_use no se arregla con prompts más largos ni con nombres más creativos. Se arregla con contratos: descripciones inmutables que indiquen qué hacer y qué no hacer; schemas que validen argumentos; retrieval que reduzca la superficie de decisión; y orquestación que limite permisos por estado. En la práctica, aplicar esta disciplina reduce los errores de selección de herramientas en la mayoría de despliegues (hasta ~80% en nuestras pruebas) y convierte agentes ruidosos en sistemas previsibles y auditablemente seguros.

Si vas a exponer nuevas herramientas a un agente, no te preguntes si el LLM “entenderá”. Pregunta primero: ¿puede automatizarse la verificación de la condición de activación y la restricción excluyente? Si la respuesta es no, no la expongas todavía. Limita opciones, mejora instrucciones y mejora tus probabilidades de tener un agente que elige bien.

Para experimentos, plantillas y recursos relacionados con agentes y workflows, revisa Dominicode Labs. Es una extensión natural de las prácticas descritas aquí, con ejemplos aplicables a despliegues reales.

FAQ
¿Por qué el LLM elige la herramienta equivocada?

Porque hay ambigüedad: solapamiento semántico entre tools, falta de fronteras negativas o sobrecarga del contexto. Si no se reducen estas fuentes, el modelo elige por probabilidades y puede fallar.

¿Qué debe contener una descripción de tool?

Cuatro campos: Propósito (una frase), Condición de activación (¿cuándo usarla? — binaria), Restricción excluyente (¿cuándo NO usarla? con alternativa) y Formato de salida (schema mínimo verificable).

¿Qué es Dynamic Tool Retrieval y cuándo usarlo?

Es el patrón de embeddizar la intención y recuperar las N tools más relevantes desde una DB vectorial (RAG de herramientas). Úsalo cuando tengas más de ~10–15 tools para reducir la superficie de decisión.

¿Cómo aplicar validación estricta en producción?

Define schemas concretos (fechas con format, enums, patterns), valida en back-end (ej. Zod) y devuelve errores estructurados. Bloquea ejecuciones si la validación falla.

¿Qué métricas debo medir primero?

Precisión de selección (tool chosen vs. expected), retries por tipo de error y tokens gastados en reintentos. También monitorea casos de tool misuse en staging.

¿Cuándo no exponer una nueva tool al agente?

Si no puedes automatizar la verificación de la condición de activación y de la restricción excluyente, no la expongas. Mejor ajusta instrucciones, schemas o añade gating por retrieval/state antes de desplegar.
June 9, 2026
Cómo implementar memoria en agentes antes de herramientas para mejorar la efectividad
Por qué tu agente necesita memoria antes de herramientas

Tiempo estimado de lectura: 4 min
- Memoria antes de herramientas: Sin memoria contextual, las herramientas incrementan errores, coste y riesgo de daño a datos y presupuesto.
- Episódica vs semántica: Episódica = historial reciente; semántica = hechos persistentes indexados por similitud.
- Run loop recomendado: Buscar semántica → recuperar episódica → ensamblar prompt → validar argumentos → ejecutar → persistir resultados.
- Métricas y trazabilidad: Mide validaciones fallidas, reintentos, TTFT, coste por request y porcentaje de intervención humana.
Si tu primer movimiento fue añadir herramientas al agente, lo estás haciendo al revés. Entender por qué tu agente necesita memoria antes de herramientas es la diferencia entre un sistema que actúa y uno que razona. Sin memoria contextual, un agente repite errores, alucina resultados y convierte cada tool en una bomba de relojería para tus datos y tu presupuesto.

Resumen rápido (lectores con prisa)

Qué es: La memoria provee contexto (episódico y semántico) que evita repetir errores y reduce alucinaciones.

Cuándo usarla: Antes de permitir que un agente invoque herramientas en producción o gestione datos persistentes.

Por qué importa: Mejora coherencia, reduce coste y riesgo, y permite recuperación cuando una tool falla.

Cómo funciona (resumen): Buscar en memoria semántica → recuperar historial episódico → ensamblar prompt → validar y ejecutar herramientas → persistir resultados.

Por qué tu agente necesita memoria antes de herramientas

Las herramientas son los actuadores; la memoria es el mapa. Cuando una llamada a una API falla o una transacción SQL choca, el agente sin memoria solo ve el último input. Reintenta lo mismo, consume tokens y, en el peor de los casos, escribe datos corruptos en producción. Con memoria —episódica y semántica— el agente sabe qué intentó, qué falló y cómo adaptar su estrategia sin volver a romper nada.

Aumentar la capacidad de acción sin dotar de historia al agente es ampliar su radio de daño.

Memoria episódica vs semántica: función y uso práctico

Memoria episódica (corto plazo)
- Qué es: historial cronológico de la sesión —mensajes, decisiones del modelo y resultados de herramientas.
- Para qué sirve: coherencia conversacional y rastreo de pasos en flujos multilargo.
- Implementación típica: Redis o caché en memoria con TTL y extracción de los últimos N eventos.
- Estrategias: sliding window (mantén los N mensajes más recientes) y resumen periódico (el modelo genera una síntesis que reemplaza bloques antiguos).
Memoria semántica (largo plazo)
- Qué es: hechos persistentes sobre usuarios, reglas, configuraciones y decisiones previas, indexados por similitud semántica.
- Para qué sirve: recuperar contexto relevante que trasciende sesiones (preferencias, infraestructuras, políticas).
- Implementación típica: bases de datos vectoriales (pgvector sobre PostgreSQL es una opción pragmática: pgvector).
- Patrón habitual: RAG aplicado a la memoria del agente —consulta embeddings antes de ensamblar el prompt.
No son intercambiables: la episódica responde “qué pasó ahora”, la semántica responde “qué deberías saber de antes”.

El run loop correcto (práctico y reproducible)

Antes de permitir que el agente invoque una tool, sigue este flujo:
1. Embeddiza el input del usuario y consulta la memoria semántica (top-k).
2. Recupera los últimos N eventos de la memoria episódica.
3. Ensambla el prompt: instrucciones base + hechos semánticos verificados + resumen episódico + herramientas disponibles.
4. Envía al modelo; si decide llamar una tool, valida los argumentos con un esquema antes de ejecutar.
5. Persiste la decisión y el resultado en la memoria episódica.
6. Si la llamada falla, serializa el error (estructura ZodError o equivalente) y úsalo para autocorrección o para encolar revisión humana.
sem = searchSemanticMemory(userVector)
epi = loadEpisodic(sessionId, N)
context = buildContext(systemPrompt, sem, epi, toolsMeta)
decision = model.decide(context)
if decision.tool → validate → execute → saveEpisodic(result)

Ese orden evita que las herramientas actúen en el vacío.

Por qué no basta con ventanas de contexto gigantes

Modelos con contexto masivo (Gemini, Claude) tienta a inyectar todo el historial en cada petición. En teoría funciona; en producción falla por tres razones:
- Latencia (TTFT): enviar 100k–1M tokens degrada la experiencia.
- Coste: procesar historial enorme en cada request sale caro.
- Precisión: la atención se degrada cuando la información clave está enterrada (lost in the middle). Ver discusión técnica.
La memoria estructurada filtra, prioriza y entrega solo lo relevante; es más eficiente, auditable y económico.

Operacionalidad: métricas y señales que importan

Mide para poder decidir:
- tasa de validación fallida de herramientas (/% llamadas rechazadas por schema),
- reintentos por fallo (media y P95),
- latencia TTFT y costo por request (tokens consumidos),
- porcentaje de decisiones que derivaron en intervención humana.
Registra siempre: prompt construido, fragments recuperados, rawResponse del LLM, result de Zod (.error.flatten()), y la tool invocada. Sin trazabilidad no hay postmortem útil.

Criterio para arquitectos y equipos

Antes de añadir una nueva tool, pregúntate: si esa tool falla, ¿el agente tiene suficiente historia para entender por qué y recuperarse sin crear daño? Si la respuesta es no, diseña memoria. Empieza con episodic + semántic básico (Redis + pgvector), políticas de resumen y validación estricta de inputs. Solo entonces añade más herramientas.

La memoria no es una mejora incremental: es la infraestructura que permite que las herramientas sean seguras, eficaces y escalables. Construir al revés es barato hoy y peligroso mañana. En el siguiente artículo veremos patrones de resumen semántico y cómo integrar autocorrección de argumentos usando errores estructurados (Zod) para convertir fallos en aprendizaje automático.

Para equipos que trabajan con agentes y workflows, una referencia práctica y recursos adicionales están disponibles en Dominicode Labs. Considera esto como continuidad técnica: plantéalo si necesitas plantillas de run loops, patrones de memoria y ejemplos de validación de herramientas.

FAQ
¿Qué diferencia práctica hay entre memoria episódica y memoria semántica?

La memoria episódica guarda el historial reciente de la sesión (mensajes, decisiones, resultados) y sirve para coherencia conversacional y seguimiento de flujos multilargo. La memoria semántica guarda hechos persistentes indexados por similitud (preferencias, reglas, configuraciones) que se recuperan entre sesiones.

¿Por qué validar argumentos antes de ejecutar una herramienta?

Validar previene ejecuciones incorrectas que consumen tokens, fallan o dañan datos en producción. Es la barrera que evita que inputs malformados o decisiones erróneas se conviertan en efectos adversos.

¿Qué métricas debo priorizar al operar agentes en producción?

Tasa de validación fallida de herramientas, reintentos por fallo (media y P95), latencia TTFT, coste por request (tokens) y porcentaje de decisiones que derivaron en intervención humana. Registra también prompt construido, fragments recuperados y rawResponse del LLM para trazabilidad.

¿Es suficiente aumentar el contexto del modelo en cada petición?

No. En producción esto aumenta latencia y coste, y puede degradar la precisión cuando información clave se pierde en un contexto enorme. La memoria estructurada entrega solo lo relevante de forma priorizada y auditable.

¿Qué hacer cuando una call a la tool falla repetidamente?

Serializa el error (estructura ZodError o equivalente), persiste el fallo en memoria episódica, usa la información para autocorrección y, si es necesario, encola revisión humana. Registra detalles para postmortem.

¿Qué herramientas tecnológicas se recomiendan para empezar?

Empezar con una memoria episódica en Redis y una memoria semántica en una base vectorial práctica como pgvector sobre PostgreSQL. Añade políticas de resumen y validación estricta de inputs antes de expandir herramientas.
June 8, 2026
Cómo redactar una spec efectiva para Claude Code
Anatomía de una buena spec para Claude Code

Tiempo estimado de lectura: 6 min
- Una spec compacta y accionable evita suposiciones del agente y reduce iteraciones.
- La estructura mínima: Requirements → Design → Tasks → Implementation.
- Para bugs: seguir Report → Analyze → Fix → Verify.
- Coloca SPEC.md junto al código y versiona la spec con el PR.
Introducción

Anatomía de una buena spec para Claude Code: si esperas que un agente genere código alineado con tu arquitectura, la spec es el mínimo imprescindible. Sin ella, Claude Code (o cualquier agente) hará suposiciones; con ella, ejecutará decisiones coherentes desde la primera iteración.

Claude Code opera sobre repositorios y contexto local; el modelo subyacente (Claude) razona según la información que le entregues. Documenta la intención antes de pedir implementación y evitarás iteraciones costosas. Referencias útiles: Anthropic — Claude Code overview y Claude.

Resumen rápido (lectores con prisa)

Qué es: Una spec compacta y accionable que define comportamiento observable, diseño, tareas y criterios de aceptación para que Claude Code ejecute sin inventar.

Cuándo usarla: Antes de pedir a un agente que implemente features o arregle bugs en un repositorio.

Por qué importa: Minimiza suposiciones del agente, reduce iteraciones y evita parches superficiales.

Cómo funciona: Estructura mínima: Requirements → Design → Tasks → Implementation; para bugs: Report → Analyze → Fix → Verify.
Anatomía de una buena spec para Claude Code: estructura y propósito

Una spec útil no es un tratado largo. Es un artefacto compacto y accionable, pensado para que un agente pueda ejecutar sin inventar. Su estructura mínima:
Requirements → 2. Design → 3. Tasks → 4. Implementation
Para bugs: Report → Analyze → Fix → Verify.

Cada bloque reduce incertidumbre y acota el espacio de decisiones del agente.

1. Requirements — qué debe hacer el sistema (externo)

Define el comportamiento observable, no la implementación.

Incluye:
Comportamiento nominal: qué hace la API/función.

Casos de borde: inputs nulos, límites, formatos erróneos.

Restricciones no funcionales: latencia p95 < 200 ms, tamaño máximo de payload 2 MB.

Dependencias permitidas/prohibidas.
Ejemplo (sin spec vs con spec):

Sin spec: “Crea endpoint para usuarios”.
Con spec: “POST /users: recibe {email, name}. Valida email según RFC 5321. Inserta en PostgreSQL usando el ORM X. Devuelve 201 con {id, email, name} o 409 si email existe. No usar nuevas dependencias.”

2. Design — cómo debe integrarse la solución (interno)

Define firmas, modelos y patrones. Evita que el agente elija un estilo distinto al del repo.

Incluye:
Firma de funciones/handlers (tipado).

Modelos DTO/Entity.

Patrones obligatorios (repositorio, servicios, inyección).

Efectos secundarios permitidos (logs, eventos, mutaciones).
Plantilla mínima:

Function: createUser(payload: CreateUserDto): Promise
Models: CreateUserDto, UserDto, UserEntity (campos, tipos)
Patterns: usar userRepository.insert, no acceso directo a SQL.

3. Tasks — pasos atómicos y ordenados

Desglosa el trabajo en tareas verificables. Un agente ejecuta mejor secuencias claras.

Ejemplo de Tasks para feature nueva:
Añadir CreateUserDto en src/models.

Implementar userRepository.insert según patrón existente.

Implementar handler POST /users con validación.

Añadir tests unitarios (caso feliz, email duplicado, payload inválido).

Actualizar documentación OpenAPI.
Cada tarea debe producir un artefacto comprobable.

4. Implementation — criterios de aceptación y pruebas

Define qué significa “terminado”. No dependas solo de que compile o pase CI.

Incluye:
Cobertura mínima (ej. 80% sobre módulo).

Tests obligatorios (unit + integración básica).

Requisitos de performance y seguridad.

Revisión arquitectónica (no introducir dependencias nuevas, mantener separaciones).
Ejemplo: “Merge solo si tests pasan y cobertura del módulo ≥ 85%; latencia p95 < 200ms en test de integración local.”
Flujo para bugs: Report → Analyze → Fix → Verify

Para corrección de errores, no saltes al fix. Sigue este flujo:
Report: pasos reproducibles, logs, versión del commit.

Analyze: causa raíz documentada (por el agente o humano) con ubicación del código.

Fix: parche mínimo que restaure el contrato.

Verify: tests que confirmen el caso original y aseguren regresión negativa.
Pedir “arregla X” sin Analyze genera parches superficiales que reaparecen.
Ejemplos reales (comparativa rápida)

Caso: validar emails

Sin spec: agente instala validator.js y devuelve distinto comportamiento al estándar del proyecto.

Con spec: “validateEmail(input: string): boolean — RFC 5321, rechaza dominios locales, no usar libs externas.” Resultado: implementación consistente y sin nuevas dependencias.

Caso: feature auth token

Sin spec: token store ad-hoc en memoria.

Con spec: define AuthToken interface, TTL, almacenamiento en redis existente y tests. Resultado: integración correcta con infra existente.
Práctica recomendada y colocación en repo
Coloca SPEC.md junto al test file o en la carpeta del feature.

Versiona la spec con el mismo PR.

Incluye ejemplos de I/O y criterios de aceptación textuales.

Si usas herramientas visuales, añade diagramas Mermaid (https://mermaid.js.org/) o contrato OpenAPI (https://spec.openapis.org/).
Conclusión

Claude Code puede automatizar implementaciones, pero su fidelidad depende de tu spec. La diferencia entre un parche plausible y una integración sostenible es específica: Requirements → Design → Tasks → Implementation para features; Report → Analyze → Fix → Verify para bugs. Escribe la spec antes de ejecutar al agente. Lo barato es ahorrar minutos ahora; lo caro es rehacer horas después.

Dominicode Labs

Si trabajas con automatización, agentes o workflows, considera recursos prácticos y experimentos en Dominicode Labs. Es una continuación lógica para explorar patrones operativos y plantillas de spec aplicables a pipelines de IA y automatización.
FAQ
¿Qué debe contener la sección Requirements de la spec?

¿Por qué es importante definir el Design explícitamente?

¿Cómo se desglosan las Tasks de forma efectiva?

¿Qué criterios deben incluirse en Implementation?

¿Cuál es el flujo recomendado para corregir bugs?

¿Dónde debo colocar la SPEC.md en el repo?
Respuesta — ¿Qué debe contener la sección Requirements de la spec?

Debe definir el comportamiento observable: casos nominales, bordes, restricciones no funcionales (p. ej. latencia, tamaño de payload) y dependencias permitidas o prohibidas.

Respuesta — ¿Por qué es importante definir el Design explícitamente?

Porque evita que el agente elija un estilo distinto al del repositorio. Definir firmas, modelos y patrones garantiza consistencia con la arquitectura existente.

Respuesta — ¿Cómo se desglosan las Tasks de forma efectiva?

Divídelas en pasos atómicos y ordenados que produzcan artefactos comprobables (archivos, tests, cambios en la API). Cada tarea debe ser verificable aisladamente.

Respuesta — ¿Qué criterios deben incluirse en Implementation?

Criterios de aceptación claros: cobertura mínima de tests, pruebas obligatorias (unit/integración), requisitos de performance y restricciones de seguridad o dependencias.

Respuesta — ¿Cuál es el flujo recomendado para corregir bugs?

Report (pasos reproducibles y logs) → Analyze (causa raíz y ubicación) → Fix (parche mínimo) → Verify (tests que confirmen y prevengan regresiones).

Respuesta — ¿Dónde debo colocar la SPEC.md en el repo?

Junto al test file o en la carpeta del feature. Versiona la spec en el mismo PR para mantener trazabilidad.
June 8, 2026
Cómo construir un producto de software desde cero usando IA
Cómo construyo un producto de software desde cero usando IA (mi proceso real)

Tiempo estimado de lectura: 4 min

Ideas clave
- Construir un producto con IA es un proceso disciplinado: define el problema, escribe una spec como única fuente de verdad y deja que un agente implemente bajo revisión.
- Spec‑Driven Development (SDD) es la columna vertebral: spec.md debe contener stack, modelado de datos, contratos API, reglas de negocio y casos de aceptación.
- Uso un agente en terminal (Claude Code) para implementar desde el repo leyendo la spec; interactúo revisando diffs y actualizando la spec cuando cambia el comportamiento.
- Pipelines: tests, linters y CI antes de merge; deploy en Vercel para front o infra reproducible para backend.
Tabla de contenidos
Construir un producto de software desde cero usando IA no es “pedir código al chat”. Es un proceso disciplinado: idea → spec con SDD → código con Claude Code → deploy. Aquí tienes mi walkthrough real, probado en proyectos que pasaron de prototipo a producción sin incendiar la base de código.

Resumen rápido (lectores con prisa)

Qué es: Un proceso disciplinado que usa Spec‑Driven Development (SDD) como única fuente de verdad y un agente en terminal (Claude Code) para ejecutar la implementación bajo revisión humana.

Cuándo usarlo: Para productos escalables y mantenibles donde la coherencia arquitectónica y la gestión de deuda técnica importan.

Por qué importa: Evita ambigüedades, reduce deuda técnica y permite iteraciones rápidas sin romper coherencia del sistema.

Cómo funciona: Define problema → escribe spec.md detallada → ejecuta al agente que lee el repo y la spec → revisa diffs → tests/CI → deploy.

1) Del problema a la frontera del producto (no a la idea vaga)

La diferencia entre una idea y un producto es la frontera: cuándo, quién, condiciones y consecuencias. Define el problema en 3–5 oraciones concretas. Quién sufre, cuándo ocurre, qué le frustra hoy y qué mediremos para saber si la solución funciona.

Usa IA aquí como auditor: hazle preguntas para descubrir supuestos y casos edge. Pero no le pidas código aún. Resultado: una descripción del problema que cualquier dev pueda leer en frío y entender.

2) Escribir la spec: Spec‑Driven Development (SDD)

SDD es la columna vertebral. Antes de una sola línea de código:
- Crea spec.md en el repo. Será la única fuente de verdad.
- Incluye stack exacto (ej.: Next.js 16, React 19, Tailwind 4).
- Modelado de datos: tablas, campos, relaciones, índices y restricciones.
- Contratos API: endpoints, payloads, respuestas, errores y códigos HTTP.
- Reglas de negocio claras: qué está permitido y qué nunca.
- Casos de prueba de aceptación (no tests automatizados, sino escenarios).
La spec elimina ambigüedad. Si algo no está en la spec, no existe para el agente.

Recurso práctico: Spec-Driven Development

3) Implementación con Claude Code (agente en terminal)

Claude Code vive en la terminal, lee archivos y puede ejecutar comandos. No es un chat: es un agente con acceso al repo.

Flujo estándar

1. git init + estructura base según spec.md.
2. Llamada inicial al agente con instrucción precisa:
Claude Code (Anthropic).
3. Reviso los diffs que propone como si fueran PRs. Aprobación explícita o feedback.
4. Si hay cambio de comportamiento, actualizo spec.md y pido refactor.

Regla innegociable: nunca corregir código sin actualizar la spec. Corrige la spec, suprime la ambigüedad, manda refactor. Así el agente aprende reglas permanentes del proyecto.

Ejemplo de prompt maestro (simplificado): “Contexto: repo vacío, spec.md adjunto. Tarea: implementar la API de autenticación según spec. Antes de modificar, lista ambigüedades. Compara con stack y patrones del repo.”

4) Tests, CI y deploy

El código sigue buenas prácticas: tests unitarios básicos, linters y pipelines en GitHub Actions. Deploy en Vercel para front o en un VPS/Cloud con infra reproducible para backend.

Pipeline típico:
- PR generado por agente → revisión humana → GitHub Actions (lint, test) → merge → deploy.
Cuando necesito añadir features: actualizo spec.md, ejecuto al agente con el repo y la spec actualizada. El contexto persistente evita “olvidos” que generan deuda técnica.

Buenas prácticas operativas (evitan dolor después)
- Versiona spec.md. Cada cambio debe tener justificación y número de versión.
- Usa ejemplos concretos en la spec (payloads de ejemplo, respuestas de error).
- Limita el scope por iteración. Un sprint = 1–2 features bien especificadas.
- Rechaza cambios grandes mediante parches rápidos: si la spec cambia radicalmente, crea una rama de arquitectura.
- Mantén un humano con criterio técnico revisando cada PR del agente.
Cuándo usar este proceso (y cuándo no)

Úsalo si necesitas un producto escalable, con datos complejos o que deba mantenerse en el tiempo. No lo burocratices para un script de 100 líneas o un prototipo desechable: ahí el prompt‑driven rápido sigue siendo válido.

Esto no es un truco mágico: es disciplina. La IA ejecuta, pero la arquitectura y el criterio técnico siguen en tus manos. Si mantienes la spec como la fuente única de verdad y tratas al agente como un colaborador que trabaja sobre ese contrato, podrás iterar rápido sin destruir la coherencia del sistema. Esto es solo la base: la próxima iteración debe cubrir cómo redactar specs resistentes y ejemplos prácticos de prompts maestro para Claude Code.

Si trabajas en automatización, agentes o workflows, este enfoque encaja con iniciativas prácticas de investigación y experimentación de herramientas y procesos. Sigue explorando en Dominicode Labs como continuación lógica para prototipado y validación de pipelines con agentes.

FAQ
¿Qué es Spec‑Driven Development (SDD)?

SDD es un marco donde una spec.md actúa como la única fuente de verdad para el desarrollo. Define stack, modelos de datos, contratos API, reglas de negocio y casos de aceptación antes de escribir código.

¿Por qué usar un agente en terminal como Claude Code?

Porque puede leer el repo, ejecutar comandos y proponer cambios como si fueran PRs. Esto permite automatizar implementaciones repetibles mientras el humano revisa y guía el resultado.

¿Qué debe contener spec.md?

Debe incluir stack exacto, modelado de datos (tablas, campos, relaciones), contratos API (endpoints, payloads, respuestas y errores), reglas de negocio y casos de aceptación con ejemplos concretos.

¿Cómo se gestionan los cambios de comportamiento?

Actualiza spec.md y crea un refactor controlado. Nunca corrijas código sin primero cambiar la spec. Esto mantiene la coherencia y enseña al agente las reglas permanentes del proyecto.

¿Cuándo no aplicar este proceso?

No lo burocratices para scripts pequeños o prototipos desechables (por ejemplo, un script de ~100 líneas). En esos casos, un enfoque prompt‑driven rápido es más eficiente.

¿Qué herramientas de CI/Deploy recomiendas?

Usa pipelines en GitHub Actions para lint y tests, y Vercel para frontends. Para backends, despliega en VPS/Cloud con infraestructura reproducible según la spec.
June 7, 2026
Cómo monitorear efectivamente agentes de IA en producción
Cómo monitorear tus agentes de IA en producción

Tiempo estimado de lectura: 5 min
Ideas clave
- Instrumentación desde el día 0: traces y spans que representen sesiones completas y decisiones individuales.
- Métricas triples: rendimiento (TTFT, percentiles), coste (tokens/coste por span/sesión) y calidad (feedback y señales automáticas).
- Elegir plataforma según arquitectura: LangSmith para stacks centrados en LangChain; Langfuse (+ ClickHouse) para portabilidad y escala.
- Cultura operacional: versionado de prompts, tests de regresión y despliegue progresivo son obligatorios.
Tabla de contenidos
Cómo monitorear tus agentes de IA en producción debería ser la primera conversación del equipo antes de lanzar una beta. Si no instrumentas traces, spans, costes y calidad desde el día 0, tu siguiente sprint será apagar fuegos y explicar facturas inexplicables.

Este artículo explica el diseño mínimo de observabilidad para agentes (LLM Observability), las métricas que importan y las decisiones tecnológicas prácticas entre plataformas como Langfuse y LangSmith. Incluye enlaces directos a recursos: Langfuse, LangSmith y ClickHouse.

Resumen rápido (lectores con prisa)

Qué es: Observabilidad para agentes de IA: traces distribuidos y spans que capturan prompts, llamadas a LLM, búsquedas vectoriales y tool calls.

Cuándo usarlo: desde el día 0 en cualquier beta u ambiente productivo que use agentes/LLMs.

Por qué importa: APMs tradicionales no detectan fallos semánticos ni picos de coste por tokens.

Cómo funciona (resumen): instrumenta spans por acción, mide rendimiento/coste/calidad, y almacena traces para query analítica y alertas.

Principio: los APM tradicionales no son suficientes

APM como Datadog o Prometheus miden latencia HTTP, errores y consumo de CPU. Perfecto para servicios deterministas. Un agente de IA devuelve HTTP 200 y puede a la vez fabricar información falsa, ejecutar llamadas externas y disparar costes por token. En ese escenario, el APM dice “todo bien” mientras tu soporte recibe tickets.

Necesitas telemetría diseñada para flujos probabilísticos: rastreo distribuido con traces que representen sesiones completas y spans que documenten cada decisión y llamada (LLM, búsqueda vectorial, tool calls, llamadas externas).

Traces y spans: la unidad mínima de diagnóstico

Diseña cada interacción como un trace. Cada acción —prompts, retrievals, llamadas a herramientas, transformaciones— es un span con metadata.

Trace: session_42
├─ Span 1: receive_prompt (userId=42, promptHash=…)
├─ Span 2: vector_search (index=kb_v1, hits=3, latency=320ms)
├─ Span 3: LLM_call (model=gpt-4o, tokens_in=1800, tokens_out=120, cost=$0.012)
└─ Span 4: synthesize_response (format=short-answer)

Con esto puedes responder rápido: ¿por qué tardó 12s? ¿qué span generó el mayor coste? ¿qué prompts producen más fallos semánticos?

Métricas imprescindibles (no negociables)

Rendimiento
- Time to First Token (TTFT): impacto directo en la UX.
- Latencia por span y percentiles: p50 / p95 / p99 por tipo de span.
Coste
- Tokens y coste por span: calcular coste por span y por session/userId.
- Coste acumulado por workflow: agente que llama al LLM varias veces debe sumar costes por workflow.
- Alertas de coste: activar alertas cuando una sesión supera un umbral definido.
Calidad
- Feedback explícito: thumbs up/down ligado al trace.
- Señales implícitas: tiempo de interacción, copias realizadas.
- LLM-as-a-judge: usar un modelo más económico para evaluar respuestas automáticamente como señal de calidad (no como veredicto absoluto).
Langfuse vs LangSmith: criterio técnico para elegir

LangSmith es excelente si tu stack está centrado en LangChain/LangGraph: integración out-of-the-box, datasets de evaluación y UI lista para depurar agentes complejos. El coste es acoplamiento: extraer datos o migrar a otro sistema será costoso.

Langfuse es agnóstico y open source; se integra con llamadas directas a APIs, Vercel AI SDK, n8n, etc. La reciente incorporación de ClickHouse al ecosistema refuerza su escalabilidad analítica: consultas sobre millones de traces con latencias bajas y análisis de coste en tiempo real. Si prevés escala o necesitas evitar vendor lock-in, Langfuse+ClickHouse es una apuesta sólida.

Decisión práctica
- Si dependes de LangChain → LangSmith.
- Si buscas portabilidad, alto throughput analítico y autoalojamiento → Langfuse (+ ClickHouse).
Implementación práctica: checklist mínimo viable
1. Wrap de llamadas al LLM: envuelve cada llamada con un SDK de observabilidad (Langfuse/LangSmith) que capture prompt, model, tokens, cost y versión del prompt.
2. Correlación: adjunta userId, sessionId y deployment/version tags a cada trace.
3. Ignorar ruido: no envíes node_modules, logs grandes o secretos. Usa reglas de exclusión (.lfignore / .langsmith-ignore).
4. Costeo por sesión: suma tokens y coste por sessionId y expón dashboards con coste por feature o cliente.
5. Evaluación automatizada: configura un pipeline de “LLM-as-a-judge” para marcar respuestas sospechosas y crear datasets de retraining.
6. Sandboxing y alertas: ejecuta tool calls en entornos aislados y genera alertas cuando spans ejecutan operaciones potencialmente destructivas.
7. Auditoría y retenimiento: guarda prompts y respuestas (con enmascarado si hay datos sensibles) para reproducibilidad y cumplimiento.
Operación y cultura: monitoreo como contrato

No es sólo técnica: es proceso. Cada cambio en prompts o pipelines debe ir acompañado de: etiquetas de versión, tests de regresión en datasets de evaluación y despliegue progresivo (canary). Sin estos pasos, la observabilidad será un registro pasivo en lugar de un control activo.

La regla final es simple: ningún agente a producción sin traces, coste por session y un mecanismo automático de evaluación. Si ignoras eso, no estás operando IA; estás apostando.

Implementa observabilidad desde el primer sprint, usa Langfuse o LangSmith según tu arquitectura y organiza tus dashboards en rendimiento, coste y calidad. La visibilidad no es un lujo: es la única forma de mantener agentes de IA útiles, seguros y rentables en producción.

Para equipos que construyen flujos, agentes o automatizaciones, una referencia práctica y recursos adicionales están disponibles en Dominicode Labs. Es una continuidad natural para explorar integración, pipelines de evaluación y despliegue controlado en proyectos de IA aplicada.

FAQ
¿Por qué los APM tradicionales no detectan problemas de agentes de IA?

Porque miden señales infraestructurales (HTTP, CPU, errores) pero no la veracidad semántica ni el consumo de tokens. Un agente puede devolver HTTP 200 y producir contenido incorrecto o costoso.

¿Qué debe contener un span para ser útil?

Metadata mínima: tipo de acción (prompt, search, tool call), timestamps, latencia, modelo, tokens_in/tokens_out, coste estimado, userId/sessionId y versión del prompt.

¿Cómo calcular el coste por sesión?

Suma los tokens y el coste asociado de todos los spans pertenecientes al mismo sessionId. Agrupa por workflow o por cliente para dashboards y alertas.

¿Cuándo elegir LangSmith sobre Langfuse?

Elige LangSmith si tu stack está fuertemente integrado con LangChain/LangGraph y aprecias integración out-of-the-box. Evita si necesitas portabilidad o evitar vendor lock-in.

¿Qué es LLM-as-a-judge y para qué sirve?

Es usar un modelo más económico para evaluar respuestas automáticamente como señal de calidad. Sirve para priorizar revisiones humanas y construir datasets de retraining, pero no debe ser el veredicto final.

¿Qué datos debo enmascarar al guardar prompts?

Enmascara datos sensibles: PII, credenciales, secretos y cualquier información regulada. Guarda versiones y hashes cuando sea posible para reproducibilidad sin exposición directa.
June 7, 2026
Cómo estructurar patrones de indicaciones para Claude Code
Patrones de indicaciones, memoria, estructura del proyecto, subagentes, habilidades para Claude Code

Tiempo estimado de lectura: 5 min
- Ideas clave:
- Claude Code necesita prompts estructurados y deterministas para operar de forma segura y efectiva.
- Una memoria explícita (ej. CLAUDE.md) y una estructura de repo modular son indispensables.
- Orquestar subagentes (p. ej. con n8n) reduce riesgo y carga cognitiva del agente principal.
- Control estricto de habilidades (tool use) y entornos sandbox evita daños en producción.
Introducción

Patrones de indicaciones, memoria, estructura del proyecto, subagentes y habilidades para Claude Code son los cinco pilares que determinan si un agente CLI acelera tu ingeniería o genera deuda técnica silenciosa. Si no defines cómo hablarle, qué puede recordar, cómo está organizado el repo, cómo se subdividen las tareas y qué permisos tiene, Claude actúa a ciegas. Aquí tienes una guía práctica y accionable para poner orden.

Resumen rápido (lectores con prisa)

Claude Code es un operador que modifica código y ejecuta shells; requiere prompts deterministas, una memoria persistente en raíz (p. ej. CLAUDE.md), una estructura de repo modular, subagentes/orquestación para QA y control estricto de habilidades. Usa TDD y sandboxes antes de delegar cambios en producción.

Claude Code como operador

Claude Code no es un chatbot; es un operador que puede leer y modificar tu código, ejecutar shells y (en previews) automatizar UIs. La diferencia clave: requiere prompts estructurados, memoria explícita del proyecto, una arquitectura de repositorio que el agente pueda razonar, subagentes u orquestadores para tareas auxiliares y un control estricto de habilidades (tool use). Documentación útil: docs.anthropic — Claude Code y, para orquestación, n8n. Para novedades y previews (p. ej. Computer Use) revisa releasebot.dev.

1) Patrones de indicaciones — cómo pedirle cosas a Claude Code

No escribas prompts vagos. Usa plantillas deterministas:

Patrón Contexto‑Restricción‑Acción

– Contexto: qué módulo, stack, rama. (“Servicio payments — Node.js/TS — branch feat/rate-limit”)

– Restricción: reglas innegociables. (“No tocar DB schema; no añadir deps externas”)

– Acción: objetivo con criterio verificable. (“Implementa rate limiting y añade tests que cubran 429; PR con test passing en CI es criterio de éxito”)

Prompt de TDD (Test-Driven Prompting)

– Paso 1: “Escribe el test que debería fallar”

– Paso 2: pedir ejecución del test

– Paso 3: solicitar la implementación hasta que los tests pasen

Ejemplo de prompt (compacto):

“Contexto: /services/payments, Node 18, TS. Restricción: no tocar migraciones. Acción: añade rate limiter en /api/charge; escribe tests unitarios y de integración; criterio: pipeline CI verde. Empieza por crear tests que fallen.”

2) Memoria — cómo mantener contexto útil y persistente

Claude Code construye su contexto leyendo el repo; no tiene intuición humana. Dos mecanismos clave:
- Memoria de sesión (corto plazo): archivos abiertos y árbol activo. Evita saturarla con monorepos gigantes; abre solo lo necesario.
- Memoria persistente (largo plazo): un archivo en la raíz que Claude lee siempre. Recomendación práctica:
– CLAUDE.md o .clauderc con:
- Convenciones de estilo y nomenclatura
- Comandos claves (tests, build, dev)
- ADRs esenciales
- Dependencias permitidas/prohibidas
- Checklists de seguridad y compliance
Este archivo convierte normas humanas en reglas ejecutables por el agente y reduce ambigüedad.

3) Estructura del proyecto — diseño para agentes

Diseña el repo pensando en unidades pequeñas y autocontenidas:
- Modularidad: archivos <300 líneas, responsabilidades únicas.
- Rutas semánticas: /auth/use-cases/login.ts en vez de /utils/helper9.ts.
- Tipado estricto: TypeScript/Rust/Go ayudan al agente a validar cambios antes de ejecutarlos.
- Tests como contrato: TDD + coverage mínimo hacen al agente predecible.
Si el repo es un monolito acoplado, prioriza una fase de refactor (extract module) manual antes de delegar en agentes.

4) Subagentes y orquestación — dividir para no perder contexto

Claude Code aún no gestiona subagentes complejos de forma nativa. La práctica efectiva es orquestar subagentes externos:

– Usa n8n o un orquestador propio para:
- Ejecutar análisis estático en entornos aislados
- Lanzar pipelines de seguridad y escaneo de dependencias
- Devolver reportes al CLI para que Claude actúe sobre ellos
Patrón típico:
1. Claude genera un PR provisional.
2. n8n ejecuta linters, SCA y tests en una VM sandbox.
3. Resultado vuelve al CLI; Claude corrige y reitera.
Así evitas que un único agente cargue demasiado contexto o tome decisiones incompletas.

5) Habilidades (Tool Use) — permisos y límites

Define explícitamente qué puede ejecutar el agente. Habilidades críticas:
- Bash Execution: npm test, git, docker-compose — imprescindible para feedback real.
- File System Access: lectura/escritura de archivos.
- Semantic Search / Repo Index: para referencias cruzadas antes de modificar.
- (Preview) Computer Use: interacción con UIs nativas — potente, frágil y debe usarse solo en sandboxes.
Regla de oro: nunca habilites habilidades destructivas en máquinas con credenciales reales. Usa contenedores o VMs aisladas.

Checklist mínimo de adopción antes de delegar tareas
1. CLAUDE.md en raíz con políticas y comandos.
2. Tests automatizados que sirvan de contrato.
3. Entorno sandbox (Docker/VM) para ejecución.
4. CI que valide PRs generados por el agente.
5. Orquestador (n8n o similar) para subagentes de QA/security.
6. Prompts basados en Contexto‑Restricción‑Acción y TDD.
Conclusión

Patrones de indicaciones, memoria, estructura del proyecto, subagentes y habilidades para Claude Code no son conceptos teóricos: son requisitos operativos. Implementados juntos, convierten a Claude en un multiplicador de capacidad. Si fallas en cualquiera, el agente acelera errores, no entrega. Empieza por documentar: CLAUDE.md, tests firmes y sandboxes. Luego automatiza, orquesta y vigila. Esto no acaba aquí: quien domine estas cinco piezas tendrá ventaja real al escalar agentes en ingeniería.

Dominicode Labs

Para equipos que integran automatización y orquestación de subagentes como parte de su plataforma de ingeniería, una continuación natural es explorar herramientas y patrones documentados en Dominicode Labs. La referencia ayuda a unir prácticas de prompts, memoria y sandboxes con flujos de trabajo reproducibles.

FAQ
¿Qué es Claude Code y en qué se diferencia de un chatbot?

Claude Code es un operador diseñado para leer y modificar repositorios, ejecutar comandos de shell y automatizar tareas. A diferencia de un chatbot, espera prompts estructurados y tiene habilidades (tool use) que deben definirse y limitarse explícitamente.

¿Qué debe contener un archivo CLAUDE.md?

Debe incluir convenciones de estilo, comandos claves (tests/build/dev), ADRs importantes, dependencias permitidas/prohibidas y checklists de seguridad. Su propósito es convertir reglas humanas en referencia legible por el agente.

¿Cuándo debo usar subagentes u orquestadores?

Úsalos cuando el pipeline requiera aislamiento (análisis estático, SCA, pruebas en sandbox) o cuando el agente principal necesite retroalimentación externa antes de cometer cambios. Orquestadores como n8n facilitan este patrón.

¿Qué habilidades del agente debo deshabilitar en producción?

Deshabilita cualquier ejecución con acceso a credenciales reales o capacidad destructiva directa sobre entornos de producción. Mantén ejecución de bash y acceso a filesystem solo en contenedores/VMs aisladas.

¿Cómo aplicar TDD con Claude Code?

Sigue el patrón: pide primero tests que fallen, ejecuta tests en sandbox, luego solicita la implementación hasta que los tests pasen. Define criterios de éxito claros (por ejemplo, pipeline CI verde) en el prompt.

¿Por qué modularizar archivos en <300 líneas?

Archivos pequeños y responsabilidades únicas facilitan que el agente razone sobre cambios y reduzcan el riesgo de efectos colaterales imprevistos.

¿Qué papel juega CI en el flujo con agentes?

CI actúa como guardián: valida PRs generados por el agente, ejecuta tests y linters y evita que cambios automatizados lleguen a producción sin verificación.
June 6, 2026

Tag: Programación

El problema real: el modelo no sabe qué decidiste ayer

Context engineering no es prompt engineering

Las 4 técnicas que uso en producción

1. CLAUDE.md / AGENTS.md — la memoria persistente del proyecto

2. Archivos de estado — lo que el modelo no puede inferir

3. Chunking de tareas — no pidas todo en un prompt

4. Resúmenes de sesión — el handoff entre el tú de hoy y el tú de mañana

Ejemplo práctico: un proyecto de tres semanas sin perder el hilo

Lo que cambia cuando aplicas esto

FAQ

El developer que ejecuta vs. el product builder que construye

Por qué ahora es el momento exacto para hacer este cambio

Qué comportamientos concretos tiene un product builder

Las cinco habilidades que nadie te enseñó en ningún bootcamp

1. Pensamiento de producto

2. Velocidad de validación

3. Escritura que convierte

4. Distribución y audiencia

5. Tolerancia a la ambigüedad

El rol de la IA en todo esto

Cómo empezar el cambio hoy (sin abandonar tu trabajo)

El cambio no es técnico. Es de identidad.

Preguntas frecuentes

La diferencia que cambia todo: LLM vs. agente

Las fases del agentic loop

Fase 1: Percibir

Fase 2: Razonar

Fase 3: Actuar

Fase 4: Observar

Repetir (o detenerse)

Cómo lo implementan las herramientas reales

Por qué los agentes fallan — y no es culpa del modelo

Cuándo usar el agentic loop (y cuándo no)

El agentic loop en 2026: dónde está el límite real

FAQ — Preguntas frecuentes sobre el agentic loop

¿Qué diferencia hay entre un chatbot y un agente con agentic loop?

¿El agentic loop necesita un modelo específico o funciona con cualquier LLM?

¿Cuántas iteraciones puede hacer un agente antes de fallar o perder el hilo?

¿Claude Code usa un agentic loop?

¿Es el agentic loop lo mismo que el “chain of thought”?

Qué cambia de raíz en Angular v22

Patrón anterior vs equivalente en Angular v22

Resource API en Angular v22: gestión de estado asíncrono sin subscribe

resource() — async state sin subscribe

rxResource() — cuando el backend habla en Observables

httpResource() — HTTP reactivo sin HttpClient.get().pipe(...)

linkedSignal() estable: el signal derivado que puedes escribir

debounced() experimental: búsquedas sin setTimeout manual

Signal Forms experimental: formularios basados en Signals

effect() ya no necesita allowSignalWrites

ChangeDetectionStrategy.Eager y el adiós definitivo a Default

Zoneless en Angular v22: cómo funciona y cuándo usarlo en producción

standalone: true ya no es necesario

Nuevo decorator @Service() en Angular v22: para qué sirve

Angular v22: tabla completa de features estables y experimentales

Cómo migrar a Angular v22 desde Angular 20 o 21: guía paso a paso

FAQ — Preguntas frecuentes sobre Angular v22

El problema real del tool_use: cuándo los agentes eligen mal sus herramientas

Resumen rápido (lectores con prisa)

El problema real del tool_use: cuándo los agentes eligen mal sus herramientas — causas

Cómo diseñar descripciones que reducen errores de selección (estructura de 4 campos)

Ejemplo práctico

Schema (JSON / Zod-like)

Schemas como enrutadores: reglas prácticas

Arquitectura para catálogos grandes: Dynamic Tool Retrieval y State Machines

Métricas y pruebas que importan

Conclusión operativa

FAQ

¿Por qué el LLM elige la herramienta equivocada?

¿Qué debe contener una descripción de tool?

¿Qué es Dynamic Tool Retrieval y cuándo usarlo?

¿Cómo aplicar validación estricta en producción?

¿Qué métricas debo medir primero?

¿Cuándo no exponer una nueva tool al agente?

Por qué tu agente necesita memoria antes de herramientas

Resumen rápido (lectores con prisa)

Por qué tu agente necesita memoria antes de herramientas

Memoria episódica vs semántica: función y uso práctico

Memoria episódica (corto plazo)

`resource()` — async state sin subscribe

`rxResource()` — cuando el backend habla en Observables

`httpResource()` — HTTP reactivo sin `HttpClient.get().pipe(...)`

`linkedSignal()` estable: el signal derivado que puedes escribir

`debounced()` experimental: búsquedas sin setTimeout manual

`effect()` ya no necesita `allowSignalWrites`

`ChangeDetectionStrategy.Eager` y el adiós definitivo a `Default`

`standalone: true` ya no es necesario

Nuevo decorator `@Service()` en Angular v22: para qué sirve