Start / Vibe-Programmierung / Vibe Coding im Jahr 2026: Wie man mit KI groß angelegte Software entwickelt (von der ersten App bis hin zum Google-Maßstab)

Vibe Coding im Jahr 2026: Wie man mit KI groß angelegte Software entwickelt (von der ersten App bis hin zum Google-Maßstab)

Unter Graham Miranda

Keine Kommentare

17. Juni 2026 10:52 Uhr.

KI-Programmierassistenten, die sowohl in einem Terminal als auch in einem Code-Editor eingesetzt werden können, wie beispielsweise Claude Code, Cursor und Codex

Inhaltsübersicht

Was ist „Vibe Coding“ eigentlich? (Die Definition von 2026)
Die ehrliche Wahrheit über “Vibe Coding bei Google oder Facebook”
So fängst du mit Vibe Coding an (die absoluten Grundlagen)
Die Tools: Was man 2026 tatsächlich nutzen sollte
- Terminal-First-Agenten (wo die eigentliche Arbeit stattfindet)
- IDE-native und visuelle Arbeitsbereiche (wo Bearbeitung und Regie aufeinandertreffen)
Die Modelle: Die Modellpalette 2026 (und wann welches Modell zum Einsatz kommt)
Das Dateisystem, das große Vibe-Coding-Projekte möglich macht (AGENTS.md, CLAUDE.md & Co.)
Ein realistischer Fahrplan: Die Entwicklung einer großen App mit Vibe, Schritt für Schritt
Die Fallstricke (auch bekannt als: Vermeide einen “Vibe-Kater”)
Ein intelligenter Vibe-Coding-Stack für 2026 (meine Empfehlung)
Häufig gestellte Fragen
Wie geht es nun weiter?

Vor zwei Jahren klang der Satz “Beschreibe einfach, was du willst, und lass die KI den Code schreiben” noch wie eine Pointe. Im Jahr 2026 wird ein großer und weiterhin wachsender Teil der weltweiten Software tatsächlich auf diese Weise entwickelt. GitHub berichtet, dass etwa 46% des gesamten neuen Codes wird nun von einer KI generiert. Google hat angegeben, dass etwa ein Viertel seiner eigenen Codebasis KI-gestützt ist. Gartner geht davon aus, dass 60% des gesamten neuen Softwarecodes soll bis Ende dieses Jahres maschinell geschrieben werden. Vibe Coding hat den Hype-Zyklus nicht nur überstanden – es hat die Branche still und leise erobert.

Ich entwickle Produktionssoftware fast ausschließlich, indem ich KI-Agenten in einfachem Englisch Anweisungen gebe. Keine von Hand eingegebene Syntax, kein Informatikstudium – nur präzise Anweisungen, gründliche Überprüfung und eine Methode, die verhindert, dass das Ganze unter seinem eigenen Gewicht zusammenbricht. Dies ist der Leitfaden, den ich mir am ersten Tag gewünscht hätte: Was „Vibe-Coding“ im Jahr 2026 wirklich bedeutet, wie man bei Null anfängt, welche Tools und Modelle sich derzeit genau lohnen – und – der Teil, den jeder insgeheim wissen möchte – ob man damit wirklich etwas in der Größenordnung von Google oder Facebook entwickeln kann.

Kurz gesagt: Mit „Vibe-Coding“ kann man erstaunlich weit kommen – weiter, als fast jeder erwartet hätte. Aber diejenigen, die ernstzunehmende, groß angelegte Software mit KI auf den Markt bringen, sind nicht diejenigen, die einem Chatbot einfach nur Prompts hinwerfen und dann auf das Beste hoffen. Sie arbeiten nach einem disziplinierten Prozess. Am Ende dieses Artikels wirst du genau wissen, wie dieser Prozess aussieht, und du wirst über einen Stack verfügen, den du noch heute nutzen kannst.

Die Dokumentationsdateien von AGENTS.md und CLAUDE.md dienen als Speicher für ein KI-Programmierprojekt — Die Informationen zu Ihrem Projekt sind in Dateien wie AGENTS.md, ROADMAP.md und TASKS.md gespeichert – nicht im Chat.

Was ist „Vibe Coding“ eigentlich? (Die Definition von 2026)

Der Begriff wurde im Februar 2025 von Andrej Karpathy geprägt und setzte sich so stark durch, dass das Collins Dictionary ihn zum Wort des Jahres 2025 kürte. Seine ursprüngliche Definition war bewusst weit gefasst: Man lässt sich von der Stimmung leiten, beschreibt, was man möchte, und akzeptiert, was das Modell zurückgibt, ohne sich um Details zu kümmern.

Diese lässige Variante ist passé, und ehrlich gesagt: Gut, dass wir sie los sind. Im Jahr 2026 bedeutet „Vibe-Coding“ etwas Erwachseneres: Sie verfassen präzise Spezifikationen in natürlicher Sprache, ein KI-Agent setzt diese um, und Sie bleiben als Architekt, Prüfer und letzte Instanz stets auf dem Laufenden. Du tippst den Code nicht selbst ein. Du gibst dem System, das den Code eingibt, Anweisungen – und du bist dafür verantwortlich, was letztendlich veröffentlicht wird.

Karpathy selbst verschob Anfang 2026 die Maßstäbe, erklärte “Vibe-Coding” für überholt und schlug vor, “Agentic Engineering” Stattdessen: “agentisch”, weil man Agenten koordiniert, anstatt 99% der Zeit Code zu schreiben, und „Engineering“, weil es, wenn man es gut macht, ein echtes Handwerk ist, hinter dem echtes Fachwissen steckt. Der Name hat sich noch nicht vollständig durchgesetzt – die meisten sagen immer noch „Vibe-Coding“ –, aber die damit beschriebene Veränderung trifft genau den Punkt. Der Schwerpunkt hat sich verlagert von Tippen zu Regie.

Hier sind die wichtigen Daten. Über 92% US-amerikanischer Entwickler nutzen mittlerweile täglich KI-basierte Programmierwerkzeuge, und weltweit nutzen 82% Entwickler diese mindestens einmal pro Woche. Unter den jüngsten Jahrgängen von Y Combinator verfügt ein bemerkenswerter Anteil der Start-ups über Codebasen, die zu über 90% durch KI generiert wurden. Das ist längst keine Randerscheinung mehr. Sie ist der Standard, und entweder beherrscht man sie fließend oder man hinkt hinterher.

Die ehrliche Wahrheit über “Vibe Coding bei Google oder Facebook”

Kommen wir gleich zum Thema „Traum“, denn das ist die Frage, die mir am häufigsten gestellt wird.

Können Sie sich dieses Wochenende hinsetzen und im Handumdrehen einen funktionierenden Klon von google.com oder facebook.com erstellen? Nein. Wer Ihnen etwas anderes erzählt, will Ihnen einen Kurs verkaufen. Hinter Google stehen Tausende von Ingenieuren, eine Infrastruktur von globalem Ausmaß, ein Jahrzehnt an weiterentwickelten Systemen und Such- sowie Ranking-Technologie, die wirklich komplex ist. Ein Screenshot eines “Facebook-Klons, der mit einem einzigen Befehl erstellt wurde”, ist ein UI-Mockup ohne echtes Backend, ohne Authentifizierung im großen Maßstab, ohne Datenmodell, das den Kontakt mit Nutzern übersteht, und ohne nennenswerte Sicherheit.

Aber hier kommt der Teil, der ist Das stimmt, und es ist die interessantere Wahrheit: Große, produktionsreife Software wird derzeit definitiv auf diese Weise entwickelt. — auch innerhalb der Unternehmen, denen Sie nacheifern wollen. Googles eigene Angabe, dass ein Viertel des gesamten Codes darauf zurückzuführen ist, spricht Bände. Der Unterschied zwischen einer oberflächlichen Demo und etwas Echtem liegt nicht in den Eingabeaufforderungen. Es liegt an der Methode.

Eine Demo ist ganz einfach. Software, die sicher, skalierbar und wartungsfreundlich ist schwierig – und genau diese Kluft ist die entscheidende Spannung beim „Vibe-Coding“ im Jahr 2026. Die Teams, die diese Kluft überwinden, behandeln KI-Agenten wie schnelle, unermüdliche, gelegentlich übermütige Nachwuchsingenieure und unterwerfen sie denselben Disziplinen, die eine gute Entwicklungsorganisation auch auf Menschen anwendet: klare Architektur, Aufteilung der Arbeit, beständiger Projektkontext, automatisierte Tests und Sicherheitsüberprüfungen, bei denen jede Zeile der KI-Ausgabe so lange als nicht vertrauenswürdig behandelt wird, bis das Gegenteil bewiesen ist.

Formuliere das Ziel also anders. Du wirst nicht puff Google ins Leben gerufen. Du kann Entwickeln Sie ein echtes, ambitioniertes Produkt mit zahlreichen Funktionen – ein soziales Netzwerk, einen Marktplatz, eine SaaS-Plattform – in echter Produktionsqualität, ganz allein oder mit einem winzigen Team, und das in einem Bruchteil der Zeit, die früher dafür nötig war. Das ist keine abgeschwächte Version des Traums. Für einen Einzelgründer grenzt das schon an Zauberei. Im weiteren Verlauf dieses Leitfadens erfährst du, wie du das konkret umsetzt.

So fängst du mit Vibe Coding an (die absoluten Grundlagen)

Falls Sie das noch nie gemacht haben, hier ist das gesamte Denkmodell in einem Satz: Sie sind der Architekt und der Regisseur; die KI ist der Bauunternehmer. Verinnerliche das, und alles andere ergibt sich von selbst.

So erzielen Sie Schritt für Schritt Ihr erstes echtes Ergebnis.

Wählen Sie einen Makler und ein Projekt aus. Verbringe keine ganze Woche damit, nach dem richtigen Tool zu suchen. Such dir einen einzigen KI-Programmier-Assistenten aus (Empfehlungen findest du weiter unten) und wähle ein kleines, aber echtes Projekt – eine persönliche Website, einen Habit-Tracker oder ein kleines Tool, das du dir wirklich wünschst. Praxis geht vor Tutorial.
Beschreiben Sie das Ergebnis, nicht die Umsetzung. Sagen Sie es dem Makler was was du willst und warum, in einfachen Worten: “Erstelle mir eine übersichtliche persönliche Website mit einer Startseite, einem Blog mit einzelnen Beitragsseiten, einem Dunkelmodus und einem Kontaktformular, über das ich E-Mails erhalte.” Du musst noch nicht wissen, was React oder PostgreSQL sind. Du musst wissen, was du willst.
Lies nach, was es bewirkt – nimm es nicht einfach so hin. Das ist die einzige Gewohnheit, die Menschen, die ihre Arbeit erfolgreich abschließen, von denen unterscheidet, die unter einem “Vibe-Kater” leiden. Wenn der Agent seinen Plan erläutert, lies ihn dir durch. Wenn er Code schreibt, bitte ihn, dir alles zu erklären, was du nicht verstehst. Du lernst hier keine Syntax auswendig, sondern entwickelst ein Gespür dafür, ob die Arbeit sinnvoll ist.
Gehen Sie in kleinen, gezielten Schritten vor. “Füge jetzt einen Schalter für den Dunkelmodus hinzu.” “Das Kontaktformular sollte die E-Mail-Adresse vor dem Absenden überprüfen.” Eine Änderung nach der anderen. Kleine Schritte sorgen dafür, dass der Agent präzise arbeitet und du konnte erkennen, wann etwas kaputtging.
Teste das Ding ständig. Klicken Sie auf jede Schaltfläche. Versuchen Sie, Ihre eigenen Formulare zum Absturz zu bringen. Bitten Sie den Mitarbeiter, Tests zu schreiben. Je schneller Sie ein Problem entdecken, desto kostengünstiger ist die Behebung.
Behandeln Sie die KI wie einen Gleichgestellten, nicht wie ein Orakel. Halte dagegen. Widersprich. Frage: “Gibt es einen einfacheren Weg?” Die goldene Regel des „Vibe-Codings“ von 2026 lautet ganz unverblümt: Veröffentliche niemals Code, den du nicht zumindest auf einer allgemeinen Ebene verstehst. Du musst nicht jede Zeile lesen. Du musst aber wissen, wozu die einzelnen Teile dienen.

Das war’s. Das ist die Schleife. Alles andere in diesem Artikel dreht sich darum, diese Schleife auszuführen. besser, bei größerer Umfang, mit dem die richtigen Werkzeuge.

Die Tools: Was man 2026 tatsächlich nutzen sollte

Der Agent ist das, womit man kommuniziert. Er liest den Quellcode, plant Änderungen, bearbeitet mehrere Dateien, führt Befehle und Tests aus und arbeitet iterativ – und das mit minimaler manueller Unterstützung. In diesem Bereich haben sich drei klare Lager herausgebildet, und die meisten intensiven Nutzer, die ich kenne, setzen zwei oder drei davon ein und verteilen die Arbeit je nach Aufgabentyp.

Terminal-First-Agenten (wo die eigentliche Arbeit stattfindet)

Diese lassen sich in Ihrem Terminal ausführen, ermöglichen die direkte Bearbeitung von Dateien auf Ihrem Rechner in einer engen Rückkopplungsschleife und sind in der Regel am besten für echte Entwicklungsaufgaben geeignet.

Claude-Code — Mein Alltagsauto und der Spitzenreiter in Sachen roher Leistung. Angetrieben von Claude Opus 4.8 führt es die SWE-Bench-Verified-Rangliste an unter 88.6%. Es ist äußerst flexibel programmierbar (Hooks, geplante “Routinen”, das ganze Programm) und liest eine CLAUDE.md Datei in Ihrem Repo, um den Projektkontext bei jeder Sitzung automatisch zu laden. Die kostenpflichtigen Tarife beginnen bei etwa $20 pro Monat.
OpenAI Codex — Dank GPT-5.5 führt es die Terminal-Bench-Rangliste an und vereint CLI, Cloud, Web und Mobile unter einem Konto – und das schon ab etwa $8 pro Monat. Ideal, wenn Sie im ChatGPT-Ökosystem zu Hause sind.
OpenCode — Das herausragende Open-Source-Projekt (über 172.000 GitHub-Stars, unter MIT-Lizenz). Es handelt sich um einen echten Terminal-Agenten, nicht um einen Wrapper, und es ist modellunabhängig: Bringen Sie den API-Schlüssel eines beliebigen Modells mit – Claude, GPT, Gemini, Kimi, GLM, DeepSeek, Qwen – und führen Sie es aus. Die Entwicklungsgeschwindigkeit ist hoch, da die Community schnell Ergebnisse liefert. Das ist die richtige Wahl, wenn Sie unabhängig von einem einzelnen Anbieter sein möchten.
Aider, Cline, Hermes-Agent, Goose, Kilo-Code — Eine solide Open-Source-Ebene. Die Nutzung ist komplett kostenlos; Sie zahlen lediglich für die Modell-Token, die Sie darüber leiten.

IDE-native und visuelle Arbeitsbereiche (wo Bearbeitung und Regie aufeinandertreffen)

Cursor — Das übersichtlichste Editor-Erlebnis rundum. Das „Composer“-Modell ist pro Ausgabe kostengünstig, und Cursor 2.0 kann bis zu acht Agenten parallel ausführen. Wenn Sie siehe Wenn Sie Ihren Code während der Regie schreiben möchten, fangen Sie hier an.
Google Antigravity — Googles „Agent-First“-Arbeitsumgebung, für Privatpersonen kostenlos in der öffentlichen Vorschau, standardmäßig mit Gemini 3.5 Flash, mit visueller Verwaltung paralleler Agenten. Der interessante Joker. (Hinweis: Die alte kostenlose Gemini-CLI-Stufe mit 1.000 Anfragen pro Tag endet 18. Juni 2026 da Google diese Funktion in die Antigravity-CLI integriert – wenn Sie also darauf angewiesen waren, ist heute der Tag, an dem Sie umsteigen sollten.)
GitHub Copilot — Die GitHub-native Option ist die beste Wahl, wenn sich Ihr Code bereits dort befindet und Sie eine Automatisierung vom Issue zum Pull-Request wünschen. Pro kostet $10 pro Monat.
Windsurfen / Devin-Desktop — Windsurf hat sich zu Devin Desktop weiterentwickelt und setzt nun auf autonome, parallel laufende Cloud-Agenten, die Pull-Requests öffnen, während Sie sich anderen Aufgaben widmen.

Ein wichtiger technischer Hinweis: Nahezu jeder seriöse Agent unterstützt mittlerweile die Model Context Protocol (MCP), ein offener Standard, mit dem Sie dieselben externen Tools (Websuche, Datenbanken, Ihr Projektmanagement usw.) in jeden Agenten mit derselben Konfiguration integrieren können. Einmal MCP lernen, überall nutzen.

Die Modelle: Die Modellpalette 2026 (und wann welches Modell zum Einsatz kommt)

Ihr Agent ist das Cockpit, das Model ist der Motor. Und Mitte 2026 war eine absolut turbulente Zeit, was Model-Veröffentlichungen angeht – drei der wichtigsten davon, die unten aufgeführt sind, erschienen in den letzten Wochen vor dem Verfassen dieses Artikels.

Die „Frontier Closed“-Modelle (höchste Leistungsfähigkeit, Premium-Preis)

Claude Opus 4.8 (Anthropic) — Ausgeliefert am 28. Mai 2026. Der unangefochtene Qualitätsführer für komplexe, dateiübergreifende Engineering-Aufgaben mit langem Kontext: 88,61 TP3T auf dem SWE-Bench (verifiziert). Der Preis beträgt 1 TP4T5 pro Million Eingabetoken und 1 TP4T25 pro Million Ausgabetoken. Darauf greife ich zurück, wenn ein Fehler teuer zu stehen käme – bei der Architektur, bei großen Refactorings, bei allem, was tragende Funktionen hat.
GPT-5.5 (OpenAI) — Liegt Kopf an Kopf mit Opus und ist Spitzenreiter bei Terminal-Bench. Liefert hervorragende, brauchbare Ergebnisse, selbst wenn in der Eingabeaufforderung Randfälle nicht berücksichtigt werden, was es ideal für schnelles Prototyping macht.
Gemini 3.1 Pro / 3.5 Flash (Google) — Leistungsstark, tief in das Google-Ökosystem und Antigravity integriert, mit Flash, das auf Geschwindigkeit optimiert ist.

Gründer, der leuchtende KI-Agenten anleitet, die Software entwickeln, und dabei das „Vibe-Coding“ im Jahr 2026 veranschaulicht — Vibe-Programmierung im Jahr 2026: Eine Person leitet ein ganzes Team von KI-Agenten.

Der Aufschwung in der offenen Gewichtsklasse (die wahre Geschichte des Jahres 2026)

Hier wird es spannend, und hier liegen die Einsparpotenziale. Eine Welle von Open-Weight-Modellen – viele davon aus chinesischen Forschungslabors – ist mittlerweile wirklich konkurrenzfähig mit den Spitzenmodellen geworden, und sie lassen sich kostengünstig oder sogar kostenlos selbst hosten. Geopolitische Faktoren spielen hier eine wichtige Rolle: Die jüngsten US-Exportbeschränkungen für führende amerikanische Modelle im Ausland haben Open-Weight-Modelle mit freizügigen Lizenzen weltweit strategisch weitaus attraktiver gemacht.

Kimi K2.7-Code (Moonshot AI) — Veröffentlicht 12. Juni 2026. Ein Monster mit offenem Gewicht und „Coding-First“-Ansatz: ein „Mixture-of-Experts“-Modell mit 1 Billion Parametern (32 Milliarden aktive pro Token), ein Kontextfenster mit 256 KB, multimodale Eingabe sowie eine modifizierte MIT-Lizenz, die eine kommerzielle Nutzung erlaubt. Moonshot gibt an, dass etwa 30% – geringere Verwendung von Argumentations-Tokens als sein Vorgänger sowie zweistellige Benchmark-Zuwächse – was von Bedeutung ist, da Token Geld sind. Es wird mit der terminalorientierten Kimi Code CLI kombiniert (Tarife ab $19/Monat) und kostet über die API etwa $0,95 pro Million eingegebener Token. Speziell entwickelt für Agent-Schleifen mit langem Zeithorizont nach dem Prinzip „Planen – Ausführen – Debuggen“. Eine ausgezeichnete Wahl für sehr lange, unbeaufsichtigte Läufe.
GLM 5.2 (Z.ai, ehemals Zhipu AI) — Veröffentlicht 13. Juni 2026, einen Tag nach Kimi. Ein MoE mit 744B Parametern (≈40B aktive) mit einem verwendbares Kontextfenster mit einer Million Token — groß genug, um ein ganzes Repository einzuspielen — sowie unter der MIT-Lizenz stehende offene Gewichte auf Hugging Face. Z.ai behauptet, dass es GPT-5.5 bei einigen Programmier-Benchmarks mit langem Zeithorizont bei etwa einem Sechstel der Kosten übertrifft, wobei zu beachten ist, dass diese Benchmarks vom Anbieter angegeben und zum Zeitpunkt der Markteinführung noch nicht unabhängig überprüft wurden. Das herausragende Feature für „Vibe“-Programmierer: Es wird über einen Anthropic-kompatiblen Endpunkt bereitgestellt und das Der GLM-Codierungsplan sieht etwa 1 bis 4 bis 10 pro Monat vor, sodass es sich nahtlos in Claude Code, OpenCode, Cline, Roo Code, Goose und Co. einfügt. Hervorragend geeignet für Frontend- und UI-lastige Aufgaben und ein unglaubliches Preis-Leistungs-Verhältnis für den Großteil Ihrer agentenbasierten Programmierarbeit.
DeepSeek V4 (und der günstigere V4-Flash) – Die erste Wahl für großvolumige, kostenorientierte Projekte, bei denen Sie anständige Qualität zu Tiefstpreisen wünschen.
Qwen 3.5 — Hervorragendes Preis-Leistungs-Verhältnis, insbesondere bei den kleineren Varianten, die auf handelsüblicher Hardware schnell laufen.

Modelle selbst ausführen: Ollama und Ollama Cloud

Wenn Ihnen Datenschutz, Kostenkontrolle oder einfach die Unabhängigkeit von fremden APIs zusagt, Ollama ist der “Docker-Moment für lokale LLMs”: Ein einziger Befehl zum Herunterladen und Ausführen offener Modelle (Llama, Qwen, Mistral, DeepSeek, Gemma und weitere) auf dem lokalen Rechner, mit einer OpenAI-kompatiblen API unter localhost:11434 auf die jeder Agent verweisen kann.

Das Problem bei lokalen Lösungen war schon immer die Hardware – offene Modelle der Spitzenklasse benötigen eine Menge VRAM. Genau das ist Ollama-Wolke löst dieses Problem und ist nun allgemein verfügbar. Es handelt sich um „Managed Inference“: Sie führen dieselben großen offenen Modelle auf den GPUs im Rechenzentrum von Ollama aus, wobei keine lokale GPU erforderlich, und – das ist das Geniale daran – es macht die identisch HTTP-API als lokale Lösung. Keine Code-Anpassungen, kein neues SDK. Sie wählen einfach ein Cloud-Modell aus und legen los. Die Preise sind erschwinglich: a kostenlose Stufe, ein Pro-Tarif: ca. $20 pro Monat, sowie eine höhere „Max“-Stufe mit etwa $100 pro Monat, die nach GPU-Zeit statt nach Tokens abgerechnet wird. Ollama verpflichtet sich zudem dazu, keine Protokolle zu führen, keine Trainings mit Ihren Daten durchzuführen und bei seinen Hosting-Partnern keinerlei Daten aufzubewahren – was wichtig ist, wenn Sie an sensiblen Themen arbeiten oder der DSGVO unterliegen.

Die multimodale Routing-Strategie

Hier ist das Muster, das die besten Praktiker tatsächlich anwenden, und es ist der mit Abstand wichtigste Kostenhebel beim Vibe-Coding: Führen Sie nicht alle Berechnungen auf dem teuersten Modell durch. Route nach Aufgabe.

Verwenden Sie ein Frontier-Modell (Opus 4.8, GPT-5.5) für den kleinen Teil der Arbeit, bei dem ein Fehler wirklich kostspielig ist: Architektur, Schema-Design, sicherheitsrelevante Logik, umfangreiche Refactorings.
Verwenden Sie ein preiswertes, robustes offenes Modell (GLM 5.2, Kimi K2.7, DeepSeek V4) für den Großteil der Routinearbeit: Implementierung der Funktionen, Standardcode, Benutzeroberfläche, Tests.
Verwenden Sie lokal oder Ollama Cloud Offene Modelle für Inferenzaufgaben mit hohem Durchsatz und geringem Risiko: Klassifizierung, Zusammenfassung, einfache Bearbeitungen.

Unternehmen, die diesen Ansatz verfolgen, senken ihre Kosten für Inferenzberechnungen regelmäßig um 60–80%, ohne dass dabei nennenswerte Qualitätseinbußen entstehen. Mit einem modellunabhängigen Agenten wie OpenCode ist der Wechsel so einfach wie das Ändern eines API-Schlüssels.

Das Dateisystem, das große Vibe-Coding-Projekte möglich macht (AGENTS.md, CLAUDE.md & Co.)

Dies ist der wichtigste Abschnitt des Artikels und – um ganz ehrlich zu sein – der Teil, auf den der Rest dieses Leitfadens hinarbeitet. Hier scheitern fast alle, mich selbst eingeschlossen, als ich angefangen habe. Gehen wir es also langsam und konkret an, denn genau das macht den Unterschied zwischen einem Projekt aus, das über Monate hinweg wächst, und einem, das bereits in der zweiten Woche still und leise scheitert.

Hier ist die harte Realität: KI-Agenten haben zwischen den Sitzungen kein Gedächtnis. Schließen Sie das Terminal, und alles, was der Agent über Ihr Projekt “wusste”, ist wie weggeblasen. Öffnen Sie morgen eine neue Sitzung, und er ist wieder ein völlig Fremder – er erinnert sich weder an Ihren Stack noch an Ihre Konventionen, noch an die Entscheidungen, die Sie letzte Woche getroffen haben, noch daran, was er gerade zur Hälfte erstellt hatte. Wechseln Sie von Claude Code zu Cursor oder tauschen Sie ein Modell gegen ein anderes aus, und Sie fangen wieder bei Null an. zweitens Zeit. Bei einem kleinen Projekt kann man alles in einem Absatz noch einmal erklären. Bei einem großen Projekt wird einem genau diese Tatsache zum Verhängnis: Man verbringt mehr Zeit damit, den Auftraggeber erneut einzuweisen, als mit der eigentlichen Entwicklung; es steht im Widerspruch zu Entscheidungen, die man bereits getroffen hat, und der Code verwandelt sich nach und nach in Spagetti-Code.

Es geht um alles oder nichts, also sage ich es ganz offen: Die Daten Ihres Projekts müssen in Dateien im Repository gespeichert sein, nicht im Chat. Der Chat ist vergänglich. Die Dateien bleiben dauerhaft erhalten. Bei jeder Sitzung baut der Agent sein Verständnis neu auf, indem er diese Dateien zuerst lesen — und da es sich um reines Markdown handelt, das in Ihrem Repo gespeichert ist, kann jeder Agent, jedes Modell und jedes Tool diese Dateien lesen. Man muss sein Projekt nie wieder von Grund auf erklären, sondern dokumentiert es einmalig und gründlich. Genau das ermöglicht es einem Projekt, Kontextwechsel, Modellwechsel und Toolwechsel zu überstehen. Und es ist auch – was kein Zufall ist – das, was es einer einzelnen Person ermöglicht, Ambitionen in der Größenordnung von Google zu verfolgen: Man behält sie nicht im Kopf, sondern speichert sie auf der Festplatte.

Hier ist die Dokumentationsschicht, die ich im Stammverzeichnis jedes ernsthaften Projekts ablege:

project-root/
├── README.md # Front Door: Was es ist, warum es existiert, wie man es ausführt
├── AGENTS.md # Werkzeugübergreifende Bedienungsanleitung für KI-Agenten (der Standard)
├── CLAUDE.md # Claude-spezifische Anleitung (kurz; importiert AGENTS.md)
├── GEMINI.md # Gemini-CLI-spezifische Anleitung (kurz; importiert AGENTS.md)
├── CONVENTIONS.md     # Programmierkonventionen (werden auch automatisch von "aider" geladen)
├── CONTEXT.md # Ausführlicher Projektkontext für Menschen + LLMs
├── llms.txt # Maschinenlesbare Übersicht über das Repo/die Dokumentation für Agenten
├── VISION.md # Das "Warum" und der langfristige Leitstern
├── ROADMAP.md # Wohin das Projekt führt: Phasen und Meilensteine
├── TASKS.md # Aktive Aufgabenliste / Arbeits-Backlog (der „Cursor“)
├── TODO.md # Lose, schnelle Erfassung von noch nicht geplanten Punkten
├── DECISIONS.md # Verzeichnis der Architekturentscheidungen (werden nie wieder geöffnet)
└── CHANGELOG.md # Für Menschen lesbare, versionierte Historie der veröffentlichten Inhalte

Das mag nach viel aussehen. Ist es aber nicht – sobald man erkennt, dass diese Dateien drei verschiedene Aufgaben erfüllen. Stellen Sie sich das so vor: drei Schichten, von den dauerhaftesten bis zu den am ehesten entbehrlichen.

Ebene 1 – Die Regeln (beständig, ändern sich selten)

Diese definieren wie Wie sich ein Agent in Ihrem Repo verhalten sollte. Sie schreiben sie frühzeitig und überarbeiten sie gelegentlich.

AGENTS.md ist das Herzstück des Systems und die Datei, die Ihr Portabilitätsproblem löst. Es ist der offene, werkzeugunabhängige Standard, um irgendein AI-Coding-Agent – So funktioniert Ihr Projekt: der Tech-Stack, Installation und Ausführung, Durchführung von Tests und Linting, zu beachtende Konventionen sowie Dinge, die Sie niemals tun sollten. Es entstand 2025 aus einer Zusammenarbeit zwischen Sourcegraph, OpenAI, Google, Cursor und Factory und wird nun von der Linux Foundation betreut, von über 30 Tools unterstützt und ist in mehr als 60.000 Repositories vertreten. Der Kernpunkt ist die Portabilität: Einmal schreiben, und Codex, Cursor, Windsurf, Cline, Copilot, Gemini CLI und weitere Tools lesen es nativ. Alles, was geteilt wird, befindet sich hier.
CLAUDE.md ist die native Befehlsdatei von Claude Code – und hier ist der Haken, an dem sich jeder die Zähne ausbeißt, und der vielleicht genau der Grund ist, warum es bei Ihnen nicht geklappt hat: Stand Mitte 2026 liest Claude Code nicht automatisch AGENTS.md. Darin heißt es CLAUDE.md. Wenn Ihr Repo nur ein AGENTS.md, Claude Code wird geladen Null Projektanweisungen, und es wird keine Warnung angezeigt. Man erhält einfach eine fehlerhafte Ausgabe und fragt sich, warum. Die Lösung ist kinderleicht und offiziell dokumentiert: Machen Sie CLAUDE.md eine kleine Datei, die die gemeinsam genutzte Datei mit einer einzigen Zeile einbindet — @AGENTS.md — Claude liest also Ihre allgemeinen Anweisungen sowie alle zusätzlichen Anweisungen, die nur für Claude gelten. (Die andere gängige Vorgehensweise ist ein Symlink: ln -s AGENTS.md CLAUDE.md, wodurch die beiden Dateien buchstäblich identisch sind.) Eine einzige Quelle der Wahrheit, keine Duplikate, keine Abweichungen.
GEMINI.md Das gleiche Prinzip gilt für Googles Gemini CLI – die toolspezifische Anleitungsdatei. Halten Sie sie kurz und lassen Sie sie auf AGENTS.md ebenfalls. Das Muster ändert sich nie: Eine gemeinsame Datei für alle, eine separate Datei pro Werkzeug.
CONVENTIONS.md enthält Ihre Programmierkonventionen – Namenskonventionen, Formatierung, Muster und die architektonischen Richtlinien. Sie ist für sich genommen nützlich und wird vom Aider-Agenten standardmäßig in den Kontext geladen. Verweisen Sie darauf von AGENTS.md Damit jedes Werkzeug denselben Standards entspricht.

Das Ergebnis dieser Ebene ist genau das, was Sie wollten: echte Werkzeugunabhängigkeit. Da die gemeinsamen Regeln in AGENTS.md Und da jedes Tool lediglich darauf verweist, können Sie dasselbe Projekt heute an Claude Code, morgen an Cursor und nächste Woche an OpenCode übergeben – und jedes arbeitet nach identischen Anweisungen. Keine erneute Einweisung, keine Bindung an einen Anbieter. Das bedeutet Portabilität in der Praxis.

Ebene 2 – Das Wissen und der Lebenszustand (das ist das eigentliche Gedächtnis)

Diese Ebene ist was das Projekt ist und der aktuelle Stand. Die “Just-Now”-Dateien ändern sich mit jeder Sitzung – sie sind das wahre Heilmittel gegen das Gedächtnisverlust.

README.md — die Startseite, in erster Linie für Menschen geschrieben: Was das Projekt ist, warum es existiert, wie man es nutzt. Jeder Neuling (und jeder Agent) beginnt hier.
CONTEXT.md — Ausführliche Hintergrundinformationen sowohl für Menschen als auch für LLMs: das Fachgebiet, das zu lösende Problem, Schlüsselkonzepte und Fachbegriffe sowie die Rahmenbedingungen. Dies ist der umfassende Kontext, der nicht in eine knappe Anleitung gehört, den ein Agent jedoch benötigt, um fundierte Entscheidungen treffen zu können.
VISION.md — Der Leitstern: Warum dieses Projekt ins Leben gerufen wurde und wohin es langfristig führen soll. So bleiben Sie und der Entwickler auf dasselbe Ziel fokussiert, auch wenn Sie gerade tief in die Arbeit an einer einzelnen Funktion vertieft sind.
llms.txt — eine kleine, maschinenlesbare Markdown-Karte, die Agenten (und Tools zum Abrufen von Dokumenten) mit einzeiligen Beschreibungen zu Ihren wichtigsten Dateien führt, damit diese schnell den richtigen Kontext finden und weniger Tokens verbrauchen. Ein ehrlicher Hinweis: Als öffentliche Website SEO-Maßnahme, llms.txt ist noch nicht bewiesen – die großen KI-Unternehmen haben sich noch nicht dazu verpflichtet, diese zu lesen, und Studien zeigen bislang keinen messbaren Vorteil für das Ranking. Aber als repo/docs Als Index für Programmierwerkzeuge macht er sich wirklich bezahlt.
ROADMAP.md — Wohin das Projekt führt, unterteilt in Phasen (siehe nächster Abschnitt) und Meilensteine. Ihr Überblick über den gesamten Weg.
TASKS.md — die wichtigste Datei für den reibungslosen Tagesablauf. Das ist die Cursor: Was bereits erledigt ist, was gerade in Arbeit ist, was als Nächstes ansteht und ob es irgendwelche Hindernisse gibt. Wenn jemand, der neu in die Sache einsteigt, dies liest, weiß er genau, wo er ansetzen muss. Halte es knapp und aktuell – es dient der schnellen Orientierung, nicht als ausführlicher Bericht.
TODO.md — eine lose Sammlung von Ideen und Kleinigkeiten, die noch nicht terminiert sind. Bewahrt TASKS.md Der Fokus liegt auf aktiver Arbeit, ohne dass dabei etwas übersehen wird.
ENTSCHEIDUNGEN.md — ein Protokoll, in das nur Einträge hinzugefügt werden können, das die von Ihnen getroffenen architektonischen Entscheidungen dokumentiert und warum. “Wir haben uns für Postgres statt SQLite entschieden, weil wir parallele Schreibvorgänge benötigen.” Genau das verhindert, dass ein Agent bereits geklärte Fragen stillschweigend erneut zur Diskussion stellt oder drei Sitzungen später einer Entscheidung widerspricht. Die neuesten Einträge stehen ganz oben; sie werden nie bearbeitet, sondern nur angehängt.
CHANGELOG.md — eine für Menschen lesbare, versionierte Aufzeichnung dessen, was tatsächlich ausgeliefert wurde, in chronologischer Reihenfolge. Sie dient sowohl als Projektverlauf als auch als schnellster Weg für eine wiederkehrende Sitzung, um zu sehen, was sich in letzter Zeit geändert hat.

Schicht 3 – Die Sitzung (vorübergehend, existiert nur im Chat)

Das ist das Gespräch, das du gerade führst. Es ist die einzige Ebene, die tut nicht gespeichert bleiben – und das ist in Ordnung, denn alles Wichtige daraus wird vor dem Schließen wieder in Ebene 2 zurückgeschrieben. Alles, was nur hier existiert, wird per Definition bald in Vergessenheit geraten.

Wie eine Sitzung konkret abläuft

Insgesamt ist der Tagesablauf fast schon langweilig – und genau darum geht es ja. Eine normale Sitzung sieht folgendermaßen aus:

Öffnen Sie die Sitzung. Als Erstes liest der Agent die Regeln und den Zustand aus: AGENTS.md (via CLAUDE.md/GEMINI.md), dann ROADMAP.md, TASKS.mdund ENTSCHEIDUNGEN.md.
Sich neu orientieren. Es meldet zurück: “Wir befinden uns in Phase 2, die letzte Aufgabe war der Anmeldeablauf, als Nächstes steht die Authentifizierungs-Middleware an, keine Hindernisse.” Sie bestätigen oder leiten weiter. Dreißig Sekunden, null Aufwand, keine erneute Einweisung.
Erledige eine Aufgabe. Es verarbeitet ein einzelnes Element aus TASKS.md, unter Einhaltung der Konventionen und unter Berücksichtigung der feststehenden Entscheidungen.
Schreibe den Speicherinhalt zurück. Bevor Sie das Fenster schließen, aktualisiert der Agent TASKS.md (Cursor bewegen), fügt eine Zeile zu CHANGELOG.md (was ausgeliefert wurde) und protokolliert jede neue Auswahl in ENTSCHEIDUNGEN.md.
Fast. Das Kontextfenster leert sich – aber das macht nichts, denn es enthielt ohnehin nichts Wertvolles. Alles befindet sich auf der Festplatte.

Wenn Sie morgen eine neue Sitzung eröffnen oder zu einem ganz anderen Tool wechseln, baut Schritt 1 den gesamten Kontext innerhalb von Sekunden wieder auf. Das So lässt sich das Problem der „Amnesie“ lösen, und genau das ist der Grund, warum ein Einzelentwickler ein großes, mehrere Monate andauerndes Projekt zusammenhängend gestalten kann.

Das ist “Agentic Engineering” in der Praxis. Die Ära des einen Mega-Prompts ist vorbei; die Ära der strategische Zerlegung ist da. Sie unterhalten sich nicht nur mit einer KI – Sie entwickeln und betreiben ein Betriebssystem für Ihre Agenten, wobei diese Dokumente als einzige verlässliche Informationsquelle dienen. Richten Sie es einmal ein, und die tägliche Arbeit wird wieder mühelos, während das Projekt still und leise über alles hinauswächst, was ein einzelnes Gespräch jemals leisten könnte.

Verteilung von Codierungsaufgaben auf mehrere KI-Modelle wie Claude, Kimi K2.7 und GLM 5.2 — Route nach Aufgabe – ein Pioniermodell für das schwierige 10%, kostengünstige Open-Weight-Modelle für den Rest.

Ein realistischer Fahrplan: Die Entwicklung einer großen App mit Vibe, Schritt für Schritt

Wie lässt sich all das nun auf ein ehrgeiziges Ziel ausrichten – sagen wir, ein echtes soziales Netzwerk oder einen Marktplatz? Man baut es nicht auf einmal auf. Man durchläuft verschiedene Phasen und lässt den Agenten in jeder Phase jeweils nur einen kleinen Schritt auf einmal ausführen.

Phase 0 – Grundlagen. Richten Sie das Repo und das oben genannte Dokumentationssystem ein und wählen Sie Ihren Stack aus. Lassen Sie ein “Hello World”-Beispiel lokal laufen. Legen Sie wichtige architektonische Entscheidungen fest, bevor Sie mit der Entwicklung von Funktionen beginnen.
Phase 1 – Architektur und Daten. Legen Sie fest, wie das System aufgebaut ist: das Datenmodell, die wichtigsten Komponenten und deren Kommunikation untereinander. Dies ist Pionierarbeit – wenn Sie hier alles richtig machen, wird alles, was danach kommt, einfacher.
Phase 2 – Kernfunktionen. Entwickeln Sie den Kern des Produkts von Anfang bis Ende, bis die primäre Nutzererfahrung funktioniert. (Beispiel für ein soziales Netzwerk: Konten, Profile, Beiträge, ein Feed.)
Phase 3 – Integrationen und Authentifizierung. Echte Authentifizierung, externe Dienste, Persistenz, das Bindeglied.
Phase 4 – Benutzeroberfläche & Feinschliff. Das Frontend, responsives Design, Internationalisierung, falls erforderlich. Hervorragende Arbeit für ein UI-starkes Modell wie GLM 5.2.
Phase 5 – Abhärtung. Tests, Leistung, Fehlerbehandlung und Sicherheit — der Teil, den Demos immer überspringen und echte Produkte niemals überspringen können.
Phase 6 – Bereitstellung und Betrieb. Stellt es bereit. Richtet die Bereitstellung, Überwachung, Backups und die Runbooks für den Fall von Störungen ein.
Phase 7 – Einführung und Einhaltung der Vorschriften. Rechtliche Hinweise, öffentliche Dokumente und (falls Sie beispielsweise in der EU tätig sind) die Datenschutz- und Offenlegungspflichten, die für eine kommerzielle Website unverzichtbar sind.
Phase 8 – Iterieren. Jetzt bist du ein echtes Produkt. Optimieren, verbessern und wachsen – für immer.

Beachten Sie, was das bewirkt: Es verwandelt eine Aufgabe, die sich wie ein unüberwindbarer Berg anfühlt (“ein soziales Netzwerk aufbauen”), in eine lange Abfolge einzelner, überschaubarer Arbeitsschritte. Das ist der springende Punkt. Großprojekte entstehen nicht durch groß angelegte Vorgaben. Sie entstehen durch tausend kleine, zielgerichtete und gut dokumentierte Schritte.

Die Fallstricke (auch bekannt als: Vermeide einen “Vibe-Kater”)

Das Jahr 2025 hat einen Spitznamen erhalten: das Jahr des Stimmungs-Kater. Viele Teams haben sich beeilt, sorgfältige Planung durch spontane Entscheidungen zu ersetzen, und sind dabei direkt mit der Realität konfrontiert worden. Lasst euch davon eine Lehre sein.

Sicherheit ist das Wichtigste. Ein Sicherheitsunternehmen hat kürzlich 15 identische Apps mit fünf beliebten Vibe-Coding-Tools erstellt und dabei festgestellt, dass 69 Sicherheitslücken, davon sechs kritische. Von KI generierter Code ist überproportional anfällig für Sicherheitslücken. Behandeln Sie jede Zeile der KI-Ausgabe als nicht vertrauenswürdig, bis sie überprüft und gescannt wurde. Lassen Sie niemals zu, dass ein Agent ohne Ihre Aufsicht eigene Authentifizierungsdaten erstellt oder mit vertraulichen Informationen umgeht.
Code-Verfall ist ein echtes Problem. Studien haben gezeigt, dass mit steigendem KI-Aufkommen die Code-Fluktuation zunimmt und sich Code-Duplikate vervielfachen. Eine konsequente Refactoring-Praxis ist daher wichtiger denn je. Der Agent sollte seine Spuren selbst beseitigen.
Eine gewisse Vertrauenslücke ist gesund. Die positive Einstellung der Entwickler gegenüber KI-Tools ist tatsächlich fiel von 77% im Jahr 2023 auf etwa 60% im Jahr 2026, obwohl die Nutzung weiter zunahm. Das ist kein Pessimismus – das ist Reife. Die Branche hat gelernt, die Tools zu nutzen, ohne ihnen blind zu vertrauen. Das sollten Sie auch tun.
Das Debuggen kann Ihre Ersparnisse aufzehren. Ein beträchtlicher Anteil der Entwickler gibt an, Ausgaben zu tätigen mehr Die Zeit, die sie für die Fehlerbehebung im KI-Code aufgewendet haben, war länger, als es gedauert hätte, ihn selbst zu schreiben – fast immer, weil sie Ergebnisse akzeptierten, die sie nicht verstanden, und Tests übersprangen. Die Lösung ist dieselbe wie immer: kleine Schritte, ständiges Testen, gründliche Überprüfung.

All das ist kein Grund, auf „Vibe-Coding“ zu verzichten. Es ist vielmehr ein Grund, es wie ein Profi zu machen.

Ein intelligenter Vibe-Coding-Stack für 2026 (meine Empfehlung)

Wenn Sie die „Analyseparalyse“ vermeiden möchten, hier ist eine konkrete Konfiguration, die ich einem Anfänger gerne empfehlen würde oder an einem ernsthaften Projekt arbeiten.

Der schlanke, nahezu kostenlose Starter-Stack

Agent: OpenCode (kostenlos, Open Source, modellunabhängig) oder Google Antigravity (kostenlos in der Vorschau).
Modelle: GLM 5.2 im Rahmen des ~$10/Monat-Coding-Plans für den Großteil der Arbeit, ergänzt durch die kostenlose Nutzungsstufe von Ollama Cloud für kleinere, aber zahlreichere Aufgaben.
Methode: das oben beschriebene „Documentation-First“-System. Das ist nicht verhandelbar.
Kosten: etwa so viel wie ein paar Tassen Kaffee im Monat.

Der „Serious-Builder“-Stack (den ich tatsächlich nutze)

Hauptwirkstoff: Claude Code – wegen seiner Leistungsfähigkeit und seiner Programmierbarkeit.
Architekturmodell: Claude Opus 4.8 für die tragtechnischen Entscheidungen.
Arbeitstier-Modelle: GLM 5.2 und Kimi K2.7 – Code für den Arbeitsalltag, der über eine modellunabhängige Konfiguration eingebunden wird. Kimi eignet sich dank seiner Token-Effizienz und seines 256K-Kontexts besonders für sehr lange, unbeaufsichtigte autonome Läufe.
Günstige/lokale Ebene: Ollama Cloud (Pro) für Inferenz mit hohem Datenaufkommen und geringem Risiko.
Kleber: MCP für Tools und eine strenge „Docs-First“-Projektstruktur, die alles miteinander verbindet.

Egal, wofür du dich entscheidest, behalte die übergeordnete Lektion im Hinterkopf: Das gewählte Tool ist weniger wichtig als der Arbeitsablauf, den man darum herum aufbaut. Ein disziplinierter Entwickler, der kostenlose Tools nutzt, wird mehr Ergebnisse liefern als ein schlampiger Entwickler, der die teuerste Software-Suite einsetzt, die man für Geld kaufen kann.

Häufig gestellte Fragen

Kann jemand, der überhaupt keine Ahnung vom Programmieren hat, im Jahr 2026 tatsächlich etwas Echtes programmieren? Ja – genau darum geht es bei diesen Tools. Auch Nicht-Ingenieure bringen funktionierende Software auf den Markt, indem sie ihre Absichten festlegen und die Ergebnisse bewerten. Man braucht zwar nach wie vor Urteilsvermögen, Geduld und die Bereitschaft, auf einer übergeordneten Ebene zu verstehen, was die KI tut, aber man muss keinen Code mehr von Hand schreiben.

Ist “Vibe Coding” noch relevant, oder wird es durch „Agentic Engineering“ abgelöst? Das Gleiche, nur mit einem besseren Namen. “Agentic Engineering” ist nichts anderes als “Vibe Coding”, nur mit Disziplin – das Koordinieren von Agenten, das Festlegen von Qualitätskontrollen und die Beibehaltung menschlicher Aufsicht an den entscheidenden Punkten. Im Gespräch sprechen die meisten Menschen immer noch von „Vibe Coding“; die dahinterstehende Praxis ist einfach ausgereifter geworden.

Welches ist derzeit das beste KI-Modell für das Programmieren? Was die Spitzenqualität angeht, sind Claude Opus 4.8 (88,61 TP3T auf SWE-Bench, verifiziert) und GPT-5.5 die Spitzenreiter. Was das beste Preis-Leistungs-Verhältnis angeht, liegen Open-Weight-Modelle wie GLM 5.2 und Kimi K2.7-Code bei einem Bruchteil der Kosten bemerkenswert nah beieinander. Die clevere Lösung besteht darin, beides zu nutzen – die Spitzenmodelle für die anspruchsvollen 10% und die preiswerten, robusten Modelle für die übrigen 90%.

Wie kann ich Vibe-Code kostenlos (oder fast kostenlos) nutzen? Verwenden Sie einen kostenlosen Open-Source-Agenten wie OpenCode, kombinieren Sie ihn mit der kostenlosen Stufe von Ollama Cloud oder einem Tarif unter $15 wie dem „Coding Plan“ von GLM oder Kimi Code, und lassen Sie Modelle mit unbegrenztem Gewicht laufen. Google Antigravity ist für Privatpersonen in der Vorschauphase ebenfalls kostenlos. Für den Preis von einem Sandwich pro Monat können Sie eine beachtliche Menge an Entwicklungsarbeit leisten.

Kann ich auf diese Weise wirklich ein Start-up oder eine umfangreiche App entwickeln? Ein echtes, funktionsreiches Produkt auf Produktionsniveau – ja, und das schaffen Leute ständig ganz allein. Ein buchstäblicher Klon von Google oder Facebook in vollem Umfang – nein, dafür braucht es Tausende von Entwicklern und eine Infrastruktur von globalem Ausmaß. Das realistische und wirklich spannende Ziel ist ein ambitioniertes Produkt in Produktionsqualität, das von einer Person oder einem winzigen Team entwickelt wird – was früher unmöglich war.

Ist von KI generierter Code sicher genug, um ihn in Produktion zu nehmen? Nicht standardmäßig. KI-Code ist überproportional anfällig für Sicherheitslücken. Daher müssen Sie ihn überprüfen und scannen, dürfen Agenten niemals unbeaufsichtigt mit Authentifizierung oder Geheimnissen umgehen lassen und müssen alle Ausgaben so lange als nicht vertrauenswürdig behandeln, bis sie verifiziert sind. Wenn Sie diese Disziplin einhalten, ist der Code absolut einsatzbereit. Wenn Sie dies jedoch blindlings tun, ist eine Sicherheitslücke vorprogrammiert.

Claude Code oder Cursor – wofür sollte sich ein Anfänger entscheiden? Wenn Sie den leistungsfähigsten Agenten wollen und sich im Terminal wohlfühlen, dann wählen Sie „Claude Code“. Wenn Sie Ihren Code in einem ausgefeilten Editor sehen möchten, während Sie die KI steuern, dann wählen Sie „Cursor“. Viele Nutzer verwenden beides. Beide sind ein guter Einstieg; machen Sie sich keine Gedanken darüber.

Was ist Ollama Cloud und warum sollte ich es nutzen? Ollama Cloud führt große Open-Source-Modelle auf verwalteten GPUs in Rechenzentren aus, sodass Sie keine teure Hardware benötigen. Dabei steht Ihnen genau dieselbe API zur Verfügung wie bei der lokalen Nutzung von Ollama – es handelt sich also um eine nahtlose Lösung. Nutzen Sie die Plattform für datenschutzfreundliche und kostengünstige Inferenz, insbesondere für Aufgaben mit hohem Datenaufkommen, und starten Sie mit einer kostenlosen Basisversion.

Was ist der Unterschied zwischen AGENTS.md und CLAUDE.md – und kann Claude Code AGENTS.md lesen? AGENTS.md ist der offene, toolübergreifende Standard (unter der Schirmherrschaft der Linux Foundation verwaltet und von Codex, Cursor, Windsurf, Cline, Gemini CLI und mehr als 30 weiteren Projekten unterstützt); CLAUDE.md ist die eigene Befehlsdatei von Claude Code. Der Haken daran: Ab Mitte 2026, Claude Code liest nicht automatisch AGENTS.md — Wenn ein Repo nur diese Datei enthält, lädt Claude Code keine Projektanweisungen und gibt keine Warnung aus. Die Lösung besteht darin, AGENTS.md als Ihre gemeinsame Informationsquelle und machen Sie CLAUDE.md eine kleine Datei, die mit einem einzigen Befehl importiert wird @AGENTS.md Zeile (oder die beiden mit einem Symlink verbinden, und zwar mit ln -s AGENTS.md CLAUDE.md). Eine Feile für die ganze Welt, eine dünne Feile pro Werkzeug.

Wie kann ich verhindern, dass ein KI-Agent mein Projekt zwischen den Sitzungen vergisst? Speichere die Projektdaten in Dateien im Repo und nicht im Chat. Bewahre eine AGENTS.md Die Regeln lauten wie folgt: a ROADMAP.md für den Plan, a TASKS.md für den aktuellen Cursor (fertig / in Bearbeitung / nächster) und ein ENTSCHEIDUNGEN.md für gesperrte Auswahlmöglichkeiten. Der Agent soll diese zu Beginn jeder Sitzung einlesen und am Ende Aktualisierungen zurückschreiben. Da auf der Festplatte ausschließlich reines Markdown gespeichert ist, bleibt der Kontext auch bei Kontext-Resets, Modellwechseln und dem Wechsel zwischen verschiedenen Tools vollständig erhalten.

Wie geht es nun weiter?

Vibe-Programmierung im Jahr 2026 ist keine Spielerei und auch keine Abkürzung für Faule. Sie ist eine echte, leistungsstarke und zunehmend Standard Eine Art, Software zu entwickeln – eine, die jedem, der bereit ist zu lernen, wie man sie richtig einsetzt, enorme Möglichkeiten eröffnet. Die Hürde für die Entwicklung von Software ist gefallen. Die neue Hürde besteht nun aus Geschmack, Urteilsvermögen und Disziplin.

Fangen Sie also heute klein an. Wählen Sie einen Agenten aus, wenden Sie ihn auf ein echtes Projekt an und durchlaufen Sie den Zyklus: beschreiben, überprüfen, iterieren, testen. Wenn Sie dann bereit sind, den Umfang zu vergrößern, richten Sie das “Documentation-First”-System ein, damit Ihr Projekt ein Gedächtnis hat und Ihre Agenten mit Ihnen mitwachsen können. Die Kluft zwischen “Ich habe eine Idee” und „Es ist live im Internet“ war noch nie so klein. Die einzige Frage, die noch offen ist, ist: Was wirst du entwickeln?.

Sie arbeiten an einem ehrgeizigen Projekt und möchten genau das Dokumentations- und Prompt-System nutzen, das das Programmieren im großen Stil erst richtig möglich macht? Das ist ein Thema für einen ganz eigenen Leitfaden – und eine großartige nächste Lektüre auf dieser Website.

Tagged:Agentic Engineering KI-Programmierung KI-Programmieragenten Ollama-Wolke Vibe-Programmierung Vibe-Programmierung für Anfänger

Graham Miranda

Herzlich willkommen! Ich bin Graham Miranda - ein lebenslanger Tüftler, unerschrockener Reisender und begeisterter Musikliebhaber. Technologie war schon immer mehr als nur ein Hobby; sie ist das Objektiv, durch das ich die Welt erkunde. Ich erforsche das Innenleben innovativer Geräte und entdecke verborgene Funktionen in alltäglichen Apps. Mein Ziel ist es, Sie mit Erkenntnissen auszustatten, die Ihnen helfen, klügere Entscheidungen zu treffen und Ihre Neugierde zu wecken. Meine Reise begann mit dem Basteln von Gadgets in meinem Schlafzimmer und entwickelte sich zu einem Tech-Blog, in dem ich praktische Berichte, leicht verständliche Anleitungen und praktische Anleitungen teile. Auf meinem Weg bin ich durch geschäftige Märkte in Bangkok gewandert, habe die Sterne in der Atacama-Wüste beobachtet und Sonnenaufgangspanoramen auf europäischen Gipfeln eingefangen - all das fließt in meine Texte ein und schürt meine Leidenschaft für Entdeckungen.

Vibe Coding im Jahr 2026: Wie man mit KI groß angelegte Software entwickelt (von der ersten App bis hin zum Google-Maßstab)

Inhaltsübersicht

Was ist „Vibe Coding“ eigentlich? (Die Definition von 2026)

Die ehrliche Wahrheit über “Vibe Coding bei Google oder Facebook”

So fängst du mit Vibe Coding an (die absoluten Grundlagen)

Die Tools: Was man 2026 tatsächlich nutzen sollte

Terminal-First-Agenten (wo die eigentliche Arbeit stattfindet)

IDE-native und visuelle Arbeitsbereiche (wo Bearbeitung und Regie aufeinandertreffen)

Die Modelle: Die Modellpalette 2026 (und wann welches Modell zum Einsatz kommt)

Die „Frontier Closed“-Modelle (höchste Leistungsfähigkeit, Premium-Preis)

Der Aufschwung in der offenen Gewichtsklasse (die wahre Geschichte des Jahres 2026)

Modelle selbst ausführen: Ollama und Ollama Cloud

Die multimodale Routing-Strategie

Das Dateisystem, das große Vibe-Coding-Projekte möglich macht (AGENTS.md, CLAUDE.md & Co.)

Ebene 1 – Die Regeln (beständig, ändern sich selten)

Ebene 2 – Das Wissen und der Lebenszustand (das ist das eigentliche Gedächtnis)

Schicht 3 – Die Sitzung (vorübergehend, existiert nur im Chat)

Wie eine Sitzung konkret abläuft

Ein realistischer Fahrplan: Die Entwicklung einer großen App mit Vibe, Schritt für Schritt

Die Fallstricke (auch bekannt als: Vermeide einen “Vibe-Kater”)

Ein intelligenter Vibe-Coding-Stack für 2026 (meine Empfehlung)

Häufig gestellte Fragen

Wie geht es nun weiter?

GLM 5.2 vs. MiniMax M3 vs. Kimi K2.7-Code: Die zwei Wochen, die die Open-Source-Programmierung neu prägten (2026)

Eine Antwort hinterlassen Antworten abbrechen

Ausgewählte Beiträge

Vibe Coding im Jahr 2026: Wie man mit KI groß angelegte Software entwickelt (von der ersten App bis hin zum Google-Maßstab)

GLM 5.2 vs. MiniMax M3 vs. Kimi K2.7-Code: Die zwei Wochen, die die Open-Source-Programmierung neu prägten (2026)

MiniMax M3 vs. Kimi K2.7 Code vs. Nemotron 3 Ultra: Die besten KI-Modelle der offenen Gewichtsklasse des Jahres 2026 im Vergleich

Vibe Coding im Jahr 2026: Wie man mit KI groß angelegte Software entwickelt (von der ersten App bis hin zum Google-Maßstab)

Inhaltsübersicht

Was ist „Vibe Coding“ eigentlich? (Die Definition von 2026)

Die ehrliche Wahrheit über “Vibe Coding bei Google oder Facebook”

So fängst du mit Vibe Coding an (die absoluten Grundlagen)

Die Tools: Was man 2026 tatsächlich nutzen sollte

Terminal-First-Agenten (wo die eigentliche Arbeit stattfindet)

IDE-native und visuelle Arbeitsbereiche (wo Bearbeitung und Regie aufeinandertreffen)

Die Modelle: Die Modellpalette 2026 (und wann welches Modell zum Einsatz kommt)

Die „Frontier Closed“-Modelle (höchste Leistungsfähigkeit, Premium-Preis)

Der Aufschwung in der offenen Gewichtsklasse (die wahre Geschichte des Jahres 2026)

Modelle selbst ausführen: Ollama und Ollama Cloud

Die multimodale Routing-Strategie

Das Dateisystem, das große Vibe-Coding-Projekte möglich macht (AGENTS.md, CLAUDE.md & Co.)

Ebene 1 – Die Regeln (beständig, ändern sich selten)

Ebene 2 – Das Wissen und der Lebenszustand (das ist das eigentliche Gedächtnis)

Schicht 3 – Die Sitzung (vorübergehend, existiert nur im Chat)

Wie eine Sitzung konkret abläuft

Ein realistischer Fahrplan: Die Entwicklung einer großen App mit Vibe, Schritt für Schritt

Die Fallstricke (auch bekannt als: Vermeide einen “Vibe-Kater”)

Ein intelligenter Vibe-Coding-Stack für 2026 (meine Empfehlung)

Häufig gestellte Fragen

Wie geht es nun weiter?

GLM 5.2 vs. MiniMax M3 vs. Kimi K2.7-Code: Die zwei Wochen, die die Open-Source-Programmierung neu prägten (2026)

Verwandte Beiträge

Eine Antwort hinterlassen Antworten abbrechen

Ausgewählte Beiträge