Índice
- ¿Qué es realmente el «vibe coding»? (La definición de 2026)
- La verdad sin tapujos sobre “programar en Google o Facebook”
- Cómo iniciarse en la programación con Vibe (los conceptos básicos imprescindibles)
- Las herramientas: qué usar realmente en 2026
- Los modelos: la gama de 2026 (y cuándo utilizar cada uno)
- El sistema de archivos que hace posibles los grandes proyectos de programación con Vibe (AGENTS.md, CLAUDE.md y demás)
- Una hoja de ruta realista: programación en Vibe de una aplicación de gran envergadura, fase a fase
- Los escollos (también conocidos como “No te quedes con resaca de buenas vibraciones”)
- Una pila de programación de Vibe para Smart 2026 (mi recomendación)
- Preguntas frecuentes
- ¿Y ahora qué?
Hace dos años, la frase “solo tienes que describir lo que quieres y dejar que la IA escriba el código” sonaba a chiste. En 2026, así es como se desarrolla, de hecho, una parte enorme y cada vez mayor del software mundial. GitHub informa de que, aproximadamente, El 46% de todo el código nuevo se genera ahora mediante IA. Google ha afirmado que aproximadamente una cuarta parte de su código fuente se desarrolla con la ayuda de la IA. Gartner prevé que 60% de todo el código de software nuevo se escribirá por ordenador antes de que termine este año. La programación de «vibe» no solo sobrevivió al ciclo de expectación, sino que, sin hacer ruido, se adueñó del sector.
Desarrollo software de producción casi exclusivamente dando instrucciones a agentes de IA en inglés sencillo. Sin sintaxis escrita a mano, sin título en informática… solo instrucciones precisas, revisiones exhaustivas y un método que evita que todo se derrumbe bajo su propio peso. Esta es la guía que me hubiera gustado que alguien me hubiera dado el primer día: en qué consiste realmente la programación «vibe» en 2026, cómo empezar desde cero, las herramientas y modelos exactos que merecen tu tiempo ahora mismo y —la parte que todo el mundo quiere saber en secreto— si realmente puedes usar esto para crear algo del tamaño de Google o Facebook.
En resumen: con la programación intuitiva se puede llegar sorprendentemente lejos, mucho más allá de lo que casi nadie esperaba. Pero quienes lanzan al mercado software serio y a gran escala con IA no son los que se limitan a lanzar indicaciones a un chatbot y a cruzar los dedos. Siguen un proceso disciplinado. Al final de este artículo sabrás exactamente en qué consiste ese proceso y dispondrás de una pila tecnológica que podrás empezar a utilizar hoy mismo.

¿Qué es realmente el «vibe coding»? (La definición de 2026)
El término fue acuñado por Andrej Karpathy en febrero de 2025 y se popularizó tanto que el Diccionario Collins lo nombró «Palabra del Año» de 2025. Su definición original era deliberadamente imprecisa: te dejas llevar por las sensaciones, describes lo que quieres y aceptas lo que te devuelve el modelo sin preocuparte por los detalles.
Esa versión desenfadada ya no existe y, sinceramente, ¡menos mal! En 2026, el «vibe coding» significa algo más maduro: Tú redactas especificaciones precisas en lenguaje natural, un agente de IA se encarga de implementarlas y tú te mantienes al tanto de todo en tu calidad de arquitecto, revisor y autoridad definitiva. No eres tú quien escribe el código. Eres tú quien da instrucciones al sistema para que escriba el código, y eres responsable de lo que se lanza al mercado.
El propio Karpathy cambió las reglas del juego a principios de 2026, al descartar la “programación intuitiva” por considerarla obsoleta y proponer “ingeniería agencial” En cambio: “agentic”, porque te dedicas a coordinar agentes en lugar de escribir código el 99% de las veces; «ingeniería», porque hacerlo bien es un auténtico oficio que requiere una verdadera experiencia. El nombre aún no se ha consolidado del todo —la mayoría de la gente sigue diciendo «vibe coding»—, pero el cambio que describe es totalmente acertado. El centro de gravedad se ha desplazado de escribiendo a dirigiendo.
Estos son los datos que importan. Acerca de 92% de desarrolladores estadounidenses utilizan ahora a diario herramientas de programación basadas en IA, y 82% de desarrolladores de todo el mundo las utilizan al menos una vez a la semana. Entre las últimas promociones de Y Combinator, una proporción notable de startups cuenta con códigos fuente generados en más de un 90% por IA. Esta ya no es una técnica marginal. Es la norma, y o bien la dominas a la perfección o te quedas atrás.
La verdad sin tapujos sobre “programar en Google o Facebook”
Hablemos directamente del sueño, porque es la pregunta que más me hacen.
¿Eres capaz de sentarte este fin de semana y crear de un tirón un clon funcional de google.com o facebook.com? No. Cualquiera que te diga lo contrario te está vendiendo un curso. Google cuenta con miles de ingenieros, una infraestructura a escala planetaria, una década de sistemas acumulados y una tecnología de búsqueda y posicionamiento que es realmente compleja. Una captura de pantalla de un “clon de Facebook creado con una sola orden” no es más que una maqueta de la interfaz de usuario sin un backend real, sin autenticación a gran escala, sin un modelo de datos que resista el contacto con los usuarios y sin una seguridad digna de ese nombre.
Pero aquí viene la parte que es Es cierto, y es la verdad más interesante: En estos momentos, el software a gran escala y destinado a la producción se está desarrollando sin duda alguna de esta manera. — incluso dentro de las empresas a las que intentas imitar. La propia estadística de Google, según la cual un cuarto de todo su código se genera mediante modelos de lenguaje, lo dice todo. La diferencia entre una demostración sin importancia y algo real no radica en las instrucciones, sino en el método.
Una demostración es fácil. Un software que es seguro, escalable y fácil de mantener es difícil, y esa brecha es la tensión que define la programación «vibe» en 2026. Los equipos que la superan tratan a los agentes de IA como ingenieros junior rápidos, incansables y, en ocasiones, demasiado seguros de sí mismos, y los someten a la misma disciplina que una buena organización de ingeniería aplica a los humanos: arquitectura clara, trabajo desglosado, contexto de proyecto persistente, pruebas automatizadas y revisión de seguridad en la que cada línea de salida de la IA se trata como no fiable hasta que se demuestre lo contrario.
Así que replantéate el objetivo. No vas a… ¡puf! un «Google» que lo hizo realidad. Tú puede Desarrolla un producto real, ambicioso y con múltiples funcionalidades —una red social, un mercado online, una plataforma SaaS— con auténtica calidad de producción, ya sea por tu cuenta o con un equipo muy reducido, en una fracción del tiempo que solía llevar. No se trata de una versión diluida de ese sueño. Para un fundador que trabaja en solitario, roza la magia. El resto de esta guía explica cómo hacerlo realmente.
Cómo iniciarse en la programación con Vibe (los conceptos básicos imprescindibles)
Si nunca lo has hecho, aquí tienes todo el modelo mental resumido en una sola frase: Tú eres el arquitecto y el director; la IA es el constructor. Asimílalo y todo lo demás vendrá solo.
A continuación te explicamos, paso a paso, cómo conseguir tu primer resultado real.
- Elige un agente y un proyecto. No te pases una semana probando herramientas. Elige un único agente de programación de IA (más abajo encontrarás algunas recomendaciones) y selecciona un proyecto pequeño pero real: una página web personal, una aplicación para llevar un seguimiento de hábitos o una herramienta sencilla que realmente te interese. Lo real es mejor que un tutorial.
- Describe el resultado, no la forma de llevarlo a cabo. Díselo al agente ¿qué? lo que quieras y ¿por qué?, en palabras sencillas: “Créame una página web personal sencilla con una página de inicio, un blog con páginas individuales para cada entrada, modo oscuro y un formulario de contacto que me envíe un correo electrónico”. Todavía no hace falta que sepas qué son React o PostgreSQL. Lo que tienes que saber es lo que quieres.
- Lee qué hace; no te limites a aceptarlo sin más. Este es el único hábito que distingue a quienes lanzan productos de quienes sufren una “resaca de inspiración”. Cuando el agente explique su plan, léelo. Cuando escriba código, pídele que te explique cualquier cosa que no entiendas. No se trata de memorizar la sintaxis, sino de desarrollar tu criterio para valorar si el trabajo tiene sentido.
- Avanza poco a poco, dando pasos concretos. “Ahora añade un botón para activar el modo oscuro”. “El formulario de contacto debería validar la dirección de correo electrónico antes de enviarlo”. Un cambio cada vez. Los pequeños pasos garantizan la precisión del agente y mantienen tú capaz de darse cuenta de cuándo se rompía algo.
- Prueba el sistema constantemente. Haz clic en todos los botones. Intenta que tus propios formularios dejen de funcionar. Pide al agente que escriba pruebas. Cuanto antes detectes un problema, más barato será solucionarlo.
- Trata a la IA como a un igual, no como a un oráculo. Plantéate las cosas. Discrepa. Pregunta: “¿Hay alguna forma más sencilla?”. La regla de oro de la programación «vibe» de 2026 es muy clara: Nunca envíes código que no entiendas, al menos a grandes rasgos. No hace falta que leas cada línea. Lo que sí tienes que saber es para qué sirve cada parte.
Eso es todo. Ese es el bucle. Todo lo demás que aparece en este artículo trata sobre cómo realizar este bucle. mejor, en a mayor escala, junto con el las herramientas adecuadas.
Las herramientas: qué usar realmente en 2026
El agente es aquello con lo que interactúas. Lee tu código fuente, planifica un cambio, edita varios archivos, ejecuta comandos y pruebas, y realiza iteraciones con una intervención manual mínima. El sector se ha dividido en tres bandos bien diferenciados, y la mayoría de los usuarios avanzados que conozco utilizan dos o tres y distribuyen el trabajo según el tipo de tarea.
Agentes que dan prioridad al terminal (donde se lleva a cabo el trabajo de verdad)
Se ejecutan en tu terminal, permiten editar archivos directamente en tu ordenador con una retroalimentación inmediata y suelen ser las más adecuadas para la ingeniería real.
- Claude Code — Mi coche de uso diario y el líder en potencia bruta. Equipado con el motor Claude Opus 4.8, encabeza la clasificación «SWE-bench Verified» en 88.6%. Es muy programable (ganchos, “rutinas” programadas, todo lo necesario) y lee un
CLAUDE.mdarchivo en tu repositorio para cargar automáticamente el contexto del proyecto en cada sesión. Los planes de pago empiezan a partir de $20 al mes. - OpenAI Codex — Con el respaldo de GPT-5.5, encabeza la clasificación de Terminal-Bench y abarca la interfaz de línea de comandos (CLI), la nube, la web y los dispositivos móviles en una sola cuenta, con un precio de entrada de alrededor de $8 al mes. Es ideal si formas parte del ecosistema de ChatGPT.
- OpenCode — El proyecto de código abierto más destacado (más de 172 000 estrellas en GitHub, con licencia del MIT). Se trata de un auténtico agente de terminal, no de una envoltura, y es independiente del modelo: solo tienes que aportar la clave API de cualquier modelo —Claude, GPT, Gemini, Kimi, GLM, DeepSeek, Qwen— y ponerlo en marcha. La velocidad de desarrollo de nuevas funciones es elevada porque la comunidad trabaja con rapidez. Esta es la mejor opción si quieres liberarte de la dependencia de un único proveedor.
- Aider, Cline, Agente Hermes, Goose, Código Kilo — Una infraestructura de código abierto y fiable. Todo es gratuito; solo pagas por los tokens de modelo que pasas por ella.
Espacios de trabajo visuales y nativos del IDE (donde la edición se une a la dirección)
- Cursor — La experiencia de edición más fluida y completa. Su modelo Composer resulta económico por salida, y Cursor 2.0 puede ejecutar hasta ocho agentes en paralelo. Si quieres véase Si quieres escribir código mientras diriges, empieza por aquí.
- Google Antigravedad — El espacio de trabajo de Google centrado en los agentes, gratis para particulares En versión preliminar pública, con Gemini 3.5 Flash como opción predeterminada y gestión visual de agentes en paralelo. El comodín interesante. (Nota: el antiguo nivel gratuito de la CLI de Gemini, de 1.000 solicitudes al día, finaliza 18 de junio de 2026 ya que Google lo va a integrar en la CLI de Antigravity, así que, si lo utilizabas, hoy es el día de cambiar.)
- GitHub Copilot — La opción nativa de GitHub, la más adecuada si tu código ya está alojado allí y quieres automatizar el proceso de pasar de incidencias a pull requests. El plan Pro cuesta $10 al mes.
- Windsurf / Devin Desktop — Windsurf se ha transformado en Devin Desktop, apostando por agentes en la nube autónomos y paralelos que abren solicitudes de incorporación de cambios mientras tú haces otras cosas.
Una nota técnica que conviene tener en cuenta: casi todos los agentes serios admiten ahora el Protocolo de contexto de modelo (MCP), un estándar abierto que te permite integrar las mismas herramientas externas (búsquedas en la web, bases de datos, tu sistema de gestión de proyectos, etc.) en cualquier agente con la misma configuración. Aprende a usar MCP una vez y utilízalo en cualquier sitio.
Los modelos: la gama de 2026 (y cuándo utilizar cada uno)
Tu agente es la cabina de mando; el modelo, el motor. Y la segunda mitad de 2026 ha sido un periodo absolutamente frenético en cuanto al lanzamiento de modelos: tres de los más importantes que se mencionan a continuación han salido al mercado en las últimas semanas, en el momento de escribir este artículo.
Los modelos «Frontier» cerrados (máximas prestaciones, precio superior)
- Claude Opus 4.8 (Anthropic) — Lanzado el 28 de mayo de 2026. Líder indiscutible en calidad para ingeniería compleja, con múltiples archivos y contextos extensos: 88,61 TP3T en SWE-bench Verified. Su precio es de $5 por millón de tokens de entrada y $25 por millón de tokens de salida. Es a lo que recurro cuando un error podría salir muy caro: arquitectura, refactorizaciones importantes, cualquier cosa que sea fundamental para el funcionamiento del sistema.
- GPT-5.5 (OpenAI) — Está a la par con Opus y es el líder en Terminal-Bench. Destaca por generar resultados útiles incluso cuando la indicación omite casos extremos, lo que lo hace ideal para la creación rápida de prototipos.
- Gemini 3.1 Pro / 3.5 Flash (Google) — Potente, profundamente integrado en el ecosistema de Google y en Antigravity, con Flash optimizado para la velocidad.

El auge de las categorías de peso libre (la verdadera historia de 2026)
Aquí es donde empieza lo divertido y donde residen los ahorros. Una oleada de modelos de peso abierto —muchos de ellos procedentes de laboratorios chinos— se ha vuelto realmente competitiva con los modelos de vanguardia, y su autoalojamiento resulta barato o gratuito. La geopolítica es uno de los factores que impulsan esta tendencia: las recientes restricciones de exportación de EE. UU. sobre los principales modelos estadounidenses en el extranjero han hecho que los modelos abiertos con licencias permisivas resulten mucho más atractivos desde el punto de vista estratégico en todo el mundo.
- Kimi K2.7-Code (Moonshot AI) — Lanzado 12 de junio de 2026. Un monstruo de peso abierto y «coding-first»: un modelo de «mezcla de expertos» con un billón de parámetros (32 mil millones activos por token), un Ventana de contexto de 256 000 tokens, entrada multimodal y una licencia MIT modificada que permite el uso comercial. Moonshot afirma que, aproximadamente, 30%: menor uso de tokens de razonamiento que su predecesor, además de unas ganancias de referencia de dos dígitos, lo cual es importante porque los tokens son dinero. Se combina con la CLI Kimi Code, orientada al terminal (planes a partir de $19 al mes), y consume aproximadamente $0,95 por cada millón de tokens introducidos a través de la API. Diseñado específicamente para bucles de agente de «planificar-ejecutar-depurar» a largo plazo. Una opción muy recomendable para ejecuciones muy largas sin supervisión.
- GLM 5.2 (Z.ai, anteriormente Zhipu AI) — Lanzamiento 13 de junio de 2026, un día después de Kimi. Un MoE con 744 mil millones de parámetros (≈40 mil millones activos) con un ventana de contexto utilizable de 1 millón de tokens — lo suficientemente grande como para alimentarlo con un repositorio completo — y pesos abiertos con licencia MIT en Hugging Face. Z.ai afirma que supera a GPT-5.5 en algunas pruebas de rendimiento de programación a largo plazo a aproximadamente una sexta parte del coste, aunque hay que tener en cuenta que esas pruebas fueron facilitadas por el propio proveedor y aún no se han verificado de forma independiente en el momento del lanzamiento. La característica estrella para los programadores más creativos: se distribuye a través de un punto final compatible con Anthropic y el El plan de codificación de GLM comienza con aproximadamente $10 al mes, así que se integra directamente con Claude Code, OpenCode, Cline, Roo Code, Goose y demás. Es ideal para trabajos de front-end y con mucha interfaz de usuario, y ofrece una relación calidad-precio increíble para la mayor parte de tu programación de agentes.
- DeepSeek V4 (y el V4-Flash, más económico) — La opción ideal para trabajos de gran volumen en los que el coste es un factor clave y se busca una calidad decente a precios muy bajos.
- Qwen 3.5 — Excelente rendimiento por parámetro, sobre todo en las variantes más pequeñas, que se ejecutan rápidamente en equipos de uso general.
Ejecutar modelos por tu cuenta: Ollama y Ollama Cloud
Si te atrae la idea de la privacidad, el control de los costes o, simplemente, no depender de la API de nadie, Ollama es el “momento Docker para los LLM locales”: un solo comando para descargar y ejecutar modelos abiertos (Llama, Qwen, Mistral, DeepSeek, Gemma y muchos más) de forma local, con una API compatible con OpenAI en localhost:11434 a la que cualquier agente pueda hacer referencia.
El problema con la computación local siempre ha sido el hardware: los modelos abiertos de última generación necesitan una gran cantidad de VRAM. Eso es precisamente lo que Nube de Ollama resuelve, y ya está disponible para todos. Se trata de una inferencia gestionada: se ejecutan esos mismos modelos abiertos de gran tamaño en las GPU del centro de datos de Ollama con no se necesita una GPU local, y —aquí está lo ingenioso— deja al descubierto el idéntico API HTTP como si fuera tu propia configuración local. Sin necesidad de reescribir el código ni de utilizar un nuevo SDK. Solo tienes que seleccionar un modelo en la nube y ya está. Los precios son asequibles: un plan gratuito, un Nivel Pro: alrededor de $20 al mes, y un nivel «Max» superior, en torno a $100 al mes, que se factura por tiempo de GPU en lugar de por tokens. Ollama también se compromete a no registrar datos, a no realizar entrenamiento con tus datos y a no conservarlos en absoluto con sus socios de alojamiento, lo cual es importante si estás trabajando con información confidencial o sujeta al RGPD.
La estrategia de enrutamiento multimodelo
Este es el patrón que utilizan realmente los mejores profesionales, y es el factor que más influye en los costes a la hora de codificar el ambiente: No utilices siempre el modelo más caro para todo. Itinerario por tarea.
- Utiliza un modelo de frontera (Opus 4.8, GPT-5.5) para esa pequeña parte del trabajo en la que un error tiene consecuencias realmente graves: arquitectura, diseño de esquemas, lógica sensible en materia de seguridad y refactorizaciones a gran escala.
- Utiliza un modelo abierto, barato y resistente (GLM 5.2, Kimi K2.7, DeepSeek V4) para la mayor parte del trabajo rutinario: implementación de características, código repetitivo, interfaz de usuario y pruebas.
- Utilice local u Ollama Cloud Modelos abiertos para inferencias de gran volumen y bajo riesgo: clasificación, resumen y ediciones sencillas.
Los equipos que optan por esta vía suelen reducir sus costes de inferencia entre un 60 y un 80% sin que ello suponga una pérdida significativa de calidad. Con un agente independiente del modelo, como OpenCode, el cambio es tan sencillo como cambiar una clave de API.
El sistema de archivos que hace posibles los grandes proyectos de programación con Vibe (AGENTS.md, CLAUDE.md y demás)
Esta es la sección más importante del artículo y —para ser totalmente sincero— la parte para la que sirve el resto de esta guía. Es donde casi todo el mundo se lleva un chasco, yo incluido cuando empecé. Así que vayamos despacio y con concreción, porque esto marca la diferencia entre un proyecto que crece durante meses y otro que se hunde silenciosamente en la segunda semana.
Esta es la cruda realidad: Los agentes de IA no conservan la memoria entre sesiones. Cierra el terminal y todo lo que el agente “sabía” sobre tu proyecto se esfuma. Abre una nueva sesión mañana y volverá a ser un completo desconocido: no recordará tu pila de tecnologías, tus convenciones, las decisiones que tomaste la semana pasada ni en qué punto se encontraba la construcción. Si cambias de Claude Code a Cursor, o sustituyes un modelo por otro, empiezas desde cero... segundo tiempo. En un proyecto pequeño, puedes volver a explicarlo todo en un párrafo. En uno grande, este simple hecho es lo que te mata: dedicas más tiempo a volver a informar al agente que a desarrollar, contradice las decisiones que ya has tomado y el código acaba convirtiéndose en un lío.
La clave está en el juego en su conjunto, así que lo diré sin rodeos: La información de tu proyecto debe almacenarse en archivos del repositorio, no en el chat. El chat es temporal. Los archivos son permanentes. En cada sesión, el agente reconstruye su comprensión mediante leer primero esos archivos — y, como se trata de código Markdown sin formato almacenado en tu repositorio, cualquier agente, cualquier modelo o cualquier herramienta puede leerlo. Dejas de tener que volver a explicar tu proyecto para siempre y lo documentas una sola vez, como es debido. Esto es lo que permite que un proyecto sobreviva a los cambios de contexto, a los cambios de modelo y a los cambios de herramientas. También es, y no por casualidad, lo que permite que una sola persona albergue una ambición del tamaño de Google: no lo guardas en tu cabeza. Lo guardas en el disco.
Esta es la estructura de documentación que incluyo en la raíz de todos los proyectos importantes:
raíz-del-proyecto/
├── README.md # Front door: qué es, por qué existe y cómo ejecutarlo
├── AGENTS.md # Instrucciones de funcionamiento de los agentes de IA para todas las herramientas (el estándar)
├── CLAUDE.md # Guía específica para el código de Claude (resumida; importa AGENTS.md)
├── GEMINI.md # Guía específica para la CLI de Gemini (breve; importa AGENTS.md)
├── CONVENTIONS.md # Convenciones de codificación (también se cargan automáticamente mediante aider)
├── CONTEXT.md # Contexto detallado del proyecto para personas y modelos de lenguaje grande (LLM)
├── llms.txt # Mapa legible por máquina del repositorio y la documentación para los agentes
├── VISION.md # El "porqué" y la estrella polar a largo plazo
├── ROADMAP.md # Hacia dónde se dirige el proyecto: fases e hitos
├── TASKS.md # Lista de tareas activas / lista de trabajo pendiente (el "cursor")
├── TODO.md # Anotaciones rápidas y generales de cosas aún no planificadas
├── DECISIONS.md # Índice de decisiones arquitectónicas (nunca se reabren)
└── CHANGELOG.md # Historial versionado y legible para el ser humano de lo que se ha lanzado
Puede parecer mucho. Pero no lo es, una vez que te das cuenta de que estos archivos realizan tres funciones diferentes. Piensas en ellos como tres capas, de los más duraderos a los más desechables.
Capa 1 — Las reglas (estables, rara vez cambian)
Estos definen cómo cómo debe comportarse un agente en tu repositorio. Los escribes al principio y los editas de vez en cuando.
AGENTS.mdes el núcleo del sistema y el archivo que resuelve tu problema de portabilidad. Es el estándar abierto e independiente de herramientas que permite indicar cualquiera Agente de programación con IA: cómo funciona tu proyecto: la pila tecnológica, cómo instalarlo y ejecutarlo, cómo realizar pruebas y linting, las convenciones que hay que seguir y lo que nunca se debe hacer. Surgió en 2025 de una colaboración entre Sourcegraph, OpenAI, Google, Cursor y Factory, y ahora está gestionado por la Fundación Linux, ha sido adoptado por más de 30 herramientas y se encuentra en más de 60 000 repositorios. La clave está en la portabilidad: se escribe una sola vez y Codex, Cursor, Windsurf, Cline, Copilot, Gemini CLI y otras herramientas lo leen de forma nativa. Todo lo compartido se encuentra aquí.CLAUDE.mdes el archivo de instrucciones nativo del propio Claude Code — y aquí está el escollo que nos juega una mala pasada a todos, y que quizá sea precisamente lo que te ha dado problemas: A mediados de 2026, Claude Code no lee automáticamenteAGENTS.md. Dice así:CLAUDE.md. Si tu repositorio solo tiene unAGENTS.md, Se carga Claude Code cero instrucciones del proyecto, y no te avisará. Simplemente obtienes un resultado peor y te preguntas por qué. La solución es muy sencilla y está documentada oficialmente: haz queCLAUDE.mdun archivo pequeño que importa el archivo compartido con una sola línea —@AGENTS.md— así que Claude lee tus instrucciones generales, además de cualquier información adicional específica de Claude. (El otro método habitual es un enlace simbólico:ln -s AGENTS.md CLAUDE.md, lo que hace que ambos sean, literalmente, el mismo archivo.) Una única fuente de información, sin duplicaciones ni discrepancias.GEMINI.mdLo mismo ocurre con la CLI de Gemini de Google: su archivo de instrucciones específico para la herramienta. Haz que sea conciso y que remita aAGENTS.mdtambién. El patrón nunca cambia: un único archivo compartido para todo el mundo, un archivo «thin» por herramienta.CONVENCIONES.mdcontiene tus convenciones de programación: nomenclatura, formato, patrones y las normas arquitectónicas a seguir. Es útil por sí mismo y es el archivo que el agente «aider» carga en el contexto por convención. Haz referencia a él desdeAGENTS.mdde modo que todas las herramientas sigan las mismas normas.
El resultado de esta capa es exactamente lo que querías: verdadera independencia de herramientas. Dado que las reglas compartidas se encuentran en AGENTS.md y cada herramienta simplemente apunta hacia él; puedes entregar el mismo proyecto hoy a Claude Code, mañana a Cursor y la semana que viene a OpenCode, y todas funcionarán siguiendo instrucciones idénticas. Sin necesidad de volver a dar instrucciones, sin dependencia de un proveedor concreto. Eso es lo que significa la portabilidad en la práctica.
Nivel 2 — El conocimiento y el estado de vida (esta es la memoria propiamente dicha)
Esta capa es ¿qué? en qué consiste el proyecto y la situación actual. Los archivos “del momento” cambian en cada sesión: son el verdadero remedio contra la amnesia.
README.md— la página de inicio, pensada en primer lugar para las personas: en qué consiste el proyecto, por qué existe y cómo funciona. Todos los recién llegados (y todos los agentes) empiezan por aquí.CONTEXT.md— Información detallada de contexto tanto para personas como para modelos de lenguaje grandes (LLM): el ámbito, el problema que se está resolviendo, los conceptos clave y la terminología, y las limitaciones. Se trata del contexto profundo que no cabe en un archivo de instrucciones conciso, pero que un agente necesita para tomar decisiones acertadas.VISION.md— La estrella polar: por qué existe este proyecto y hacia dónde se dirige a largo plazo. Te ayuda a ti y al agente a mantener la vista puesta en el mismo objetivo cuando estáis inmersos en una sola funcionalidad.llms.txt— un pequeño mapa en Markdown, legible por máquinas, que guía a los agentes (y a las herramientas de recuperación de documentos) hacia tus archivos más importantes con descripciones de una sola línea, para que encuentren rápidamente el contexto adecuado y gasten menos tokens. Una advertencia sincera: como página web pública Táctica de SEO,llms.txtaún no está demostrado: las principales empresas de IA no se han comprometido a leerlo y los estudios aún no muestran ningún beneficio cuantificable en el posicionamiento. Pero como un repo/docs Como índice para los agentes de codificación, cumple con su función.ROADMAP.md— hacia dónde se dirige el proyecto, desglosado en fases (véase la siguiente sección) y hitos. Tu mapa de todo el recorrido.TASKS.md— el archivo más importante para la continuidad del día a día. Este es el cursor: lo que ya se ha hecho, lo que se está haciendo ahora mismo, lo que viene a continuación y cualquier obstáculo. Cuando alguien nuevo se ponga al día con esto, sabrá exactamente por dónde empezar. Que sea conciso y esté actualizado: sirve para orientarse rápidamente, no es un texto literario.TODO.md— Un espacio para anotar ideas y pequeñas cosas que aún no están programadas. Sirve paraTASKS.mdcentrado en el trabajo activo sin que se nos escape ningún detalle.DECISIONS.md— un registro de solo adición de las decisiones arquitectónicas que has tomado y ¿por qué?. “Elegimos Postgres en lugar de SQLite porque necesitamos poder realizar escrituras simultáneas”. Esto es lo que impide que un agente vuelva a plantear discretamente cuestiones ya resueltas o contradiga una elección tres sesiones más tarde. Lo más reciente aparece primero; nunca se edita, solo se añade.CHANGELOG.md— un registro legible para el usuario y con versiones de lo que realmente se ha publicado, en orden. Es a la vez el historial de tu proyecto y la forma más rápida de que una sesión que vuelve pueda ver qué ha cambiado recientemente.
Capa 3 — La sesión (efímera, solo existe en el chat)
Esta es la conversación que estás manteniendo ahora mismo. Es la única capa que no se conserva — y eso está bien, porque todo lo importante que contenga se vuelve a guardar en la Capa 2 antes de cerrarla. Todo lo que solo se encuentra aquí está, por definición, a punto de caer en el olvido.
Cómo se desarrolla realmente una sesión
En conjunto, la rutina diaria resulta casi aburrida, y esa es precisamente la idea. Una sesión normal es así:
- Inicia la sesión. Lo primero que hace el agente es leer las reglas y el estado:
AGENTS.md(víaCLAUDE.md/GEMINI.md), entoncesROADMAP.md,TASKS.mdyDECISIONS.md. - Reorientar. El sistema responde: “Estamos en la fase 2; la última tarea fue el flujo de inicio de sesión; la siguiente es el middleware de autenticación; no hay obstáculos”. Tú lo confirmas o lo rediriges. Treinta segundos, sin esfuerzo alguno, sin necesidad de volver a dar instrucciones.
- Haz una tarea. Funciona con un único elemento de
TASKS.md, siguiendo las normas y respetando las decisiones ya tomadas. - Vuelve a escribir los datos en la memoria. Antes de cerrar la operación, el agente actualiza
TASKS.md(mueve el cursor), añade una línea aCHANGELOG.md(lo que se ha enviado) y registra cualquier nueva elección enDECISIONS.md. - Cerrar. La ventana de contexto se vacía, pero no importa, porque no contenía nada de valor. Todo está en el disco.
Mañana, cuando abras una nueva sesión o cambies a una herramienta totalmente diferente, el paso 1 reconstruye todo el contexto en cuestión de segundos. Eso Así es como se resuelve el problema de la amnesia, y esa es precisamente la razón por la que un constructor que trabaja en solitario puede mantener la coherencia en un proyecto grande que se prolonga durante varios meses.
Esto es la “ingeniería agencial” llevada a la práctica. La era del «mega-prompt» único ha llegado a su fin; la era de descomposición estratégica Ya está aquí. No te limitas a charlar con una IA: estás creando y gestionando un sistema operativo para tus agentes, con estos documentos como única fuente de información fiable. Configúralo una vez y el trabajo diario volverá a resultarte sencillo, mientras el proyecto crece silenciosamente más allá de lo que una simple conversación podría abarcar jamás.

Una hoja de ruta realista: programación en Vibe de una aplicación de gran envergadura, fase a fase
Entonces, ¿cómo se aplica todo esto a un proyecto ambicioso —por ejemplo, una red social o un mercado en toda regla?—. No se construye todo de una vez. Se avanza por fases y, dentro de cada una de ellas, solo se deja que el agente trabaje en un pequeño paso cada vez.
- Fase 0 — Fundamentos. Configura el repositorio y el sistema de documentación mencionado anteriormente, y elige tu pila tecnológica. Haz que funcione un “hello world” en tu equipo local. Define bien las decisiones arquitectónicas importantes antes de desarrollar cualquier funcionalidad.
- Fase 1 — Arquitectura y datos. Define la estructura del sistema: el modelo de datos, los componentes principales y cómo se comunican entre sí. Se trata de un trabajo pionero: si lo haces bien, todo lo que venga después resultará más fácil.
- Fase 2 — Funcionalidades principales. Desarrolla el núcleo del producto de principio a fin hasta que el recorrido principal del usuario funcione correctamente. (En el caso de una red social: cuentas, perfiles, publicación de contenidos y un feed.)
- Fase 3 — Integraciones y autenticación. Autenticación real, servicios externos, persistencia, el tejido conectivo.
- Fase 4 — Interfaz y pulido. La interfaz de usuario, el diseño adaptativo y la internacionalización, si la necesitas. Un trabajo excelente para un modelo con una interfaz de usuario tan sólida como el GLM 5.2.
- Fase 5: Fortalecimiento. Pruebas, rendimiento, gestión de errores y seguridad — esa parte que las demostraciones siempre se saltan y que los productos reales nunca pueden omitir.
- Fase 6 — Implementación y operaciones. Pónlo en marcha. Configura la implementación, la supervisión, las copias de seguridad y los procedimientos de actuación para cuando surjan problemas.
- Fase 7 — Puesta en marcha y cumplimiento normativo. Las páginas legales, los documentos públicos y (si operas en un lugar como la UE) los requisitos de privacidad y divulgación, que son imprescindibles para un sitio web comercial.
- Fase 8 — Iterar. Ahora ya eres un producto de verdad. Corrige, mejora y crece, sin parar.
Fíjate en lo que consigue esto: convierte una tarea que parece imposible (“crear una red social”) en una larga secuencia de sesiones individuales y factibles. Ahí está el truco. Los proyectos de gran envergadura no se construyen a partir de grandes retos, sino de mil pequeños pasos bien orientados y bien documentados.
Los escollos (también conocidos como “No te quedes con resaca de buenas vibraciones”)
El año 2025 se ganó un apodo: el año del resaca emocional. Muchos equipos se apresuraron a sustituir una ingeniería meticulosa por las indicaciones y se topó de lleno con la realidad. Aprended de ello.
- La seguridad es lo más importante. Una empresa de seguridad ha creado recientemente 15 aplicaciones idénticas utilizando cinco herramientas populares de programación y ha descubierto que 69 vulnerabilidades, seis de ellas críticas. El código generado por IA es desproporcionadamente propenso a presentar fallos de seguridad. Trata cada línea de código generada por IA como no fiable hasta que haya sido revisada y analizada. Nunca permitas que un agente cree su propio sistema de autenticación ni gestione información confidencial sin tu supervisión.
- La degradación del código es una realidad. Varios estudios han puesto de manifiesto un aumento de la rotación de código y una multiplicación del código duplicado a medida que crece el volumen de IA. La disciplina en la refactorización es más importante que nunca. Haz que el agente se encargue de limpiar lo que genera.
- La falta de confianza es algo saludable. La opinión favorable de los desarrolladores hacia las herramientas de IA, en realidad, cayó de 77% en 2023 a unos 60% en 2026, a pesar de que el uso siguió aumentando. Eso no es pesimismo, es madurez. El sector ha aprendido a utilizar las herramientas sin confiar ciegamente en ellas. Tú también deberías hacerlo.
- La depuración puede acabarse con tus ahorros. Una parte considerable de los desarrolladores afirma haber gastado más más tiempo en corregir el código de IA que el que les habría llevado escribirlo ellos mismos —casi siempre porque aceptaban resultados que no entendían y se saltaban las pruebas—. La solución es la misma de siempre: pequeños pasos, pruebas constantes y una revisión rigurosa.
Nada de esto es motivo para evitar la programación intuitiva. Es motivo para hacerlo como un profesional.
Una pila de programación de Vibe para Smart 2026 (mi recomendación)
Si quieres evitar quedarte bloqueado por el exceso de análisis, aquí tienes una configuración concreta que no dudaría en recomendar a un principiante o trabajar en un proyecto serio.
El paquete de inicio básico y casi gratuito
- Agente: OpenCode (gratuito, de código abierto y compatible con cualquier modelo) o Google Antigravity (gratuito en versión preliminar).
- Modelos: GLM 5.2, utilizando el plan de codificación de ~$10 al mes para la mayor parte del trabajo, además del nivel gratuito de Ollama Cloud para tareas sueltas de gran volumen.
- Método: el sistema de «documentación primero» mencionado anteriormente. No es negociable.
- Coste: más o menos lo que cuestan un par de cafés al mes.
El conjunto de herramientas para desarrolladores profesionales (el que yo utilizo)
- Agente principal: Claude Code, por su potencia bruta y su gran capacidad de programación.
- Maqueta arquitectónica: Claude Opus 4.8 para las decisiones relativas a la capacidad de carga.
- Modelos Workhorse: GLM 5.2 y Kimi K2.7: código para el día a día, integrado mediante una configuración independiente del modelo. Kimi resulta especialmente adecuado para ejecuciones autónomas muy largas y sin supervisión, gracias a su eficiencia en el uso de tokens y a su contexto de 256K.
- Capa económica/local: Ollama Cloud (Pro) para inferencias de gran volumen y bajo riesgo.
- Pegamento: MCP para las herramientas y una estructura de proyecto rigurosa basada en el enfoque «documentación primero» que lo integra todo.
Elijas lo que elijas, recuerda la lección fundamental: La herramienta que elijas importa menos que el flujo de trabajo que desarrolles en torno a ella. Un desarrollador disciplinado que utilice herramientas gratuitas superará en volumen de entrega a uno descuidado que utilice el conjunto de herramientas más caro que el dinero pueda comprar.
Preguntas frecuentes
¿Podrá alguien que no sabe nada de programación crear algo de verdad en 2026? Sí, ese es precisamente el objetivo de estas herramientas. Las personas que no son ingenieros están lanzando software funcional simplemente especificando lo que quieren conseguir y evaluando los resultados. Sigue siendo necesario tener criterio, paciencia y ganas de aprender en líneas generales cómo funciona la IA, pero ya no hace falta escribir código a mano.
¿Sigue siendo relevante la “programación de vibraciones”, o la está sustituyendo la «ingeniería agencial»? Es lo mismo, pero con un nombre mejor. La “ingeniería de agentes” no es más que la programación intuitiva llevada a cabo con disciplina: coordinar agentes, definir controles de calidad y mantener la supervisión humana en los puntos críticos. La mayoría de la gente sigue hablando de “programación intuitiva” en sus conversaciones; lo que hay detrás de esta práctica simplemente ha madurado.
¿Cuál es el mejor modelo de IA para programar en este momento? En cuanto a calidad superior, Claude Opus 4.8 (88,61 TP3T en SWE-bench Verified) y GPT-5.5 son los líderes de vanguardia. En cuanto a la mejor relación calidad-precio, los modelos de peso abierto como el GLM 5.2 y el Kimi K2.7-Code están muy cerca en rendimiento a una fracción del coste. La solución más inteligente es utilizar ambos: los de vanguardia para los difíciles 10%, y los económicos y resistentes para los otros 90%.
¿Cómo puedo descargar código de Vibe gratis (o casi gratis)? Utiliza un agente gratuito y de código abierto como OpenCode, combínalo con el nivel gratuito de Ollama Cloud o con un plan de menos de $15, como el «Coding Plan» de GLM o Kimi Code, y ejecuta modelos de peso abierto. Google Antigravity también es gratuito para particulares en fase de prueba. Puedes desarrollar una gran cantidad de proyectos por el precio de un bocadillo al mes.
¿De verdad puedo crear una startup o una aplicación a gran escala de esta manera? Un producto real, con múltiples funciones y apto para producción: sí, y hay gente que lo hace en solitario todo el tiempo. Un clon literal de Google o Facebook a gran escala: no, para eso se necesitan miles de ingenieros y una infraestructura a escala planetaria. El objetivo realista y verdaderamente emocionante es un producto ambicioso, creado con calidad de producción por una sola persona o un equipo muy pequeño, algo que antes era imposible.
¿Es el código generado por IA lo suficientemente seguro como para lanzarlo? No de forma predeterminada. El código de IA es desproporcionadamente propenso a sufrir vulnerabilidades, por lo que debes revisarlo y analizarlo; nunca permitas que los agentes gestionen la autenticación o los secretos sin supervisión, y considera que toda la información generada no es fiable hasta que se haya verificado. Si se aplica esta disciplina, el código es perfectamente apto para su implementación. Si se hace a ciegas, es una brecha de seguridad en potencia.
Claude Code o Cursor: ¿cuál debería elegir un principiante? Si quieres el agente más potente y te sientes cómodo en una terminal, elige Claude Code. Si prefieres ver tu código en un editor bien diseñado mientras diriges la IA, elige Cursor. Mucha gente utiliza ambos. Cualquiera de los dos es un buen punto de partida; no te lo compliques demasiado.
¿Qué es Ollama Cloud y para qué me serviría? Ollama Cloud ejecuta grandes modelos de código abierto en GPU de centros de datos gestionados, por lo que no necesitas hardware costoso, al tiempo que ofrece exactamente la misma API que al ejecutar Ollama localmente, por lo que es una solución lista para usar. Úsalo para realizar inferencias que respeten la privacidad y controlen los costes, especialmente en trabajos de gran volumen, con un nivel gratuito para empezar.
¿Cuál es la diferencia entre AGENTS.md y CLAUDE.md? ¿Y Claude Code lee AGENTS.md? AGENTS.md es el estándar abierto y compatible con múltiples herramientas (gestionado por la Fundación Linux y adoptado por Codex, Cursor, Windsurf, Cline, Gemini CLI y más de 30 proyectos adicionales); CLAUDE.md es el archivo de instrucciones nativo de Claude Code. El problema es que, a partir de mediados de 2026, Claude Code no lee automáticamente AGENTS.md — Si un repositorio solo contiene ese archivo, Claude Code no carga ninguna instrucción del proyecto y no muestra ninguna advertencia. La solución es mantener AGENTS.md como tu fuente de información de referencia y haz que CLAUDE.md un archivo pequeño que se importa con un solo @AGENTS.md línea (o crear un enlace simbólico entre ambos con ln -s AGENTS.md CLAUDE.md). Una lima para todo, una lima fina para cada herramienta.
¿Cómo puedo evitar que un agente de IA se olvide de mi proyecto entre sesiones? Guarda la documentación del proyecto en archivos dentro del repositorio, no en el chat. Mantén un AGENTS.md Para conocer las normas, a ROADMAP.md para el plan, un TASKS.md para el cursor actual (terminado / en curso / siguiente), y un DECISIONS.md para las opciones bloqueadas. Haz que el agente las lea al inicio de cada sesión y que anote las actualizaciones al final. Como todo está en formato Markdown sin formato en el disco, el contexto se conserva incluso tras reinicios del contexto, cambios de modelo y cambios de herramienta.
¿Y ahora qué?
La programación Vibe en 2026 no es un truco publicitario ni un atajo para los perezosos. Es algo real, potente y cada vez más estándar una forma de desarrollar software —una que ofrece un enorme potencial a cualquiera que esté dispuesto a aprender a manejarla bien—. La barrera para crear software se ha derrumbado. La nueva barrera es el buen gusto, el criterio y la disciplina.
Así que empieza poco a poco hoy mismo. Elige un agente, aplícalo a un proyecto real y pon en marcha el ciclo: describe, revisa, itera, prueba. Después, cuando estés listo para ampliar la escala, configura el sistema “documentación primero” para que tu proyecto tenga memoria y tus agentes puedan crecer contigo. La distancia entre “tengo una idea” y «ya está en Internet» nunca ha sido tan pequeña. La única pregunta que queda es: ¿qué vas a crear?.
¿Estás desarrollando un proyecto ambicioso y quieres contar con el sistema exacto de documentación y indicaciones que hace que la programación colaborativa a gran escala funcione de verdad? Eso es tema para una guía completa en sí misma, y una lectura muy recomendable en esta web.









