Strukturierte Prompts: Warum gute KI-Anweisungen wie kleine technische Artefakte sind

Wenn ich mit KI-Coding arbeite, merke ich immer wieder denselben Unterschied: Ein schwacher Prompt klingt wie eine Bitte. Ein guter Prompt funktioniert wie ein kleines technisches Artefakt.

Das klingt zunächst pedantisch, ist aber praktisch. Ein Sprachmodell kann sehr viel implizit ergänzen. Genau das macht es nützlich. Genau das macht es aber auch riskant, wenn ich eigentlich reproduzierbare Ergebnisse will. Je weniger Struktur ich liefere, desto mehr muss das Modell raten: Ziel, Randbedingungen, Datenmodell, gewünschte Tiefe, Ausgabeformat, verbotene Wege und Abbruchkriterien.

Strukturierte Prompts und Prompt-Patterns sind deshalb keine Prompt-Magie. Sie sind eine Arbeitsdisziplin. Sie übersetzen vage Absicht in eine Form, die ein Modell konsistenter verarbeiten und ein Mensch leichter prüfen kann.

Visualisierung: Ein vager Wunsch wird über Role, Task, Context und Constraints in konsistente Artefakte wie Code, Tests und strukturierte Ausgabe übersetzt. — Der Kern strukturierter Prompts: Ich reduziere Interpretationsspielraum, bevor das Modell arbeitet. Aus einer freien Bitte wird eine klare Arbeitsanweisung.

Warum Prompts überhaupt Struktur brauchen

Ein Prompt ist im KI-Coding selten nur eine Frage. Er ist eher ein temporärer Vertrag zwischen Mensch, Modell, Codebase und Werkzeugen. In ihm steht, welche Rolle das Modell einnehmen soll, welche Aufgabe wirklich gemeint ist, welcher Kontext zählt und welche Grenzen nicht verletzt werden dürfen.

Ohne diese Struktur entstehen typische Reibungsverluste: Das Modell optimiert eine Query, obwohl es das Schema nicht kennt. Es schlägt einen Index vor, obwohl Migrationen tabu sind. Es liefert Prosa, obwohl eine Pipeline JSON erwartet. Oder es refactort nebenbei Dateien, die gar nicht Teil der Aufgabe waren.

Meine Faustregel: Sobald ein KI-Ergebnis weiterverarbeitet, getestet, reviewed oder automatisiert genutzt werden soll, reicht ein freier Prompt nicht mehr. Dann braucht die Anfrage Struktur.

RTCC als Grundform: Role, Task, Context, Constraints

Das einfachste Muster, das ich praktisch fast überall einsetzen kann, ist RTCC: Role, Task, Context, Constraints. Es zwingt mich, vier Dinge zu trennen, die in schlechten Prompts oft durcheinanderlaufen.

Role: Welche Expertise soll aktiviert werden? Zum Beispiel: Senior-Engineer mit Fokus auf Postgres-Performance, Security-Reviewer, Frontend-Architekt oder Testingenieur. Die Rolle ersetzt kein Fachwissen, fokussiert aber die Perspektive.

Task: Was genau soll passieren? Eine gute Aufgabe ist scharf umrissen. Nicht „mach es besser“, sondern „reduziere die p95-Latenz dieser Query unter 50 ms und erkläre die Trade-offs“.

Context: Welche Fakten sind relevant? Codeausschnitte, Datenmodell, Laufzeit, Constraints aus dem Projekt, bisherige Versuche, Fehlermeldungen, Logs und Architekturentscheidungen gehören hierhin.

Constraints: Was darf nicht passieren? Kein Schemawechsel, keine neue Dependency, keine Änderung außerhalb eines Moduls, bestimmtes Ausgabeformat, nur Analyse statt Codeänderung, oder zuerst Rückfragen stellen.

RTCC ist keine starre Vorlage. Für sehr kleine Aufgaben reicht manchmal ein Satz. Aber sobald die Aufgabe mehrdeutig wird, verhindert diese Struktur, dass das Modell aus Bequemlichkeit eigene Annahmen nach vorne zieht.

Ein schwacher Prompt und eine bessere Variante

Der Unterschied wird sichtbar, wenn man einen typischen Alltags-Prompt auseinanderzieht.

Schwach

„Mach die Abfrage schneller.“

Strukturiert

„Optimiere diese Query mit Blick auf p95-Latenz unter 50 ms. Berücksichtige 80 Mio. Zeilen, aktuellen Indexstand, kein Partitioning und keine ungeprüften Schemaänderungen.“

Die schwache Variante zwingt das Modell zu Annahmen. Es weiß nicht, ob es SQL ändern darf, ob neue Indexe erlaubt sind, ob eine Migration möglich ist, welche Datenmenge relevant ist und woran Erfolg gemessen wird. Die strukturierte Variante begrenzt den Suchraum. Dadurch wird die Antwort nicht nur besser, sondern auch reviewbarer.

Role: Du bist Senior-Engineer mit Fokus auf Postgres 16 Performance.

Task: Optimiere die unten gezeigte Query so, dass die p95-Latenz unter 50 ms bleibt.

Context:
- Tabelle orders hat ca. 80 Mio. Zeilen.
- Aktuell existiert nur ein Index auf created_at.
- Kein Partitioning.
- Die Query wird im Checkout-Pfad verwendet.

Constraints:
- Kein Schemawechsel ohne explizite Markierung.
- Erkläre die Wirkung jedes Indexvorschlags in einem Satz.
- Liefere das Ergebnis als zwei Markdown-Codeblöcke:
  1. SQL
  2. EXPLAIN-Plan-Annotation

Prompt-Patterns: Bausteine für wiederkehrende Situationen

RTCC ist die Grundstruktur. Prompt-Patterns sind die ergänzenden Bausteine für spezielle Situationen. Ich denke dabei nicht an Tricks, sondern an wiederverwendbare Formen, die bestimmte Fehlerklassen reduzieren.

Few-Shot-Beispiele Zwei oder drei kuratierte Vorher/Nachher-Beispiele wirken oft stärker als lange Prosa. Besonders bei Stilfragen, Refactorings, Commit Messages, Dokumentationsformaten und wiederkehrenden Ausgabeformen.

Negative Beispiele Ich zeige explizit, was nicht passieren darf. Das ist hilfreich, wenn ein Modell wiederholt Scope-Creep betreibt, falsche Abstraktionen einführt oder ein Ausgabeformat knapp verfehlt.

Output-Schema JSON-Schema, Markdown-Gerüst oder XML-Tags machen die Ausgabe maschinenlesbar und leichter prüfbar. Für Automatisierung ist das häufig der entscheidende Schritt.

Self-Consistency Mehrere Lösungspfade werden erzeugt und die robustesten Anteile übernommen. Das kostet mehr Tokens, lohnt sich aber bei algorithmischen Problemen oder Architekturentscheidungen mit mehreren plausiblen Wegen.

Step-Back-Prompting Vor der konkreten Lösung wird erst das zugrundeliegende Prinzip geklärt: Welche Frage steckt eigentlich dahinter? Das hilft bei unklaren Bugs, Architekturentscheidungen und schlecht formulierten Anforderungen.

Visualisierung: Mehrere Prompt-Patterns wie Beispiele, negative Beispiele, Output-Schema, Self-Consistency, Step-Back und RTCC sind als Module um eine zentrale Prompt-Werkbank angeordnet. — Prompt-Patterns sind wiederverwendbare Module. Je nach Aufgabe kombiniere ich RTCC mit Beispielen, Negativbeispielen, Schemas oder einer expliziten Validierung.

Warum ich Chain-of-Thought heute vorsichtig sehe

Ein älteres Pattern ist Chain-of-Thought: Das Modell soll seine Zwischenschritte sichtbar machen. Für Lern- oder Analysegespräche kann eine nachvollziehbare Begründung hilfreich sein. Für produktive Coding-Workflows ist aber wichtiger, dass das Modell prüfbare Ergebnisse liefert: Tests, Diffs, Annahmen, offene Fragen, Quellen, Schema-Validierung.

Moderne Reasoning-Modelle arbeiten intern ohnehin mit Zwischenüberlegungen. Ich fordere deshalb nicht pauschal „denk Schritt für Schritt“ an. Besser ist: „Nenne zuerst deine Annahmen“, „zeige die relevanten Risiken“, „liefere einen Testplan“ oder „prüfe die Ausgabe gegen dieses Schema“. Das führt zu verwertbarer Transparenz, ohne dass ich interne Denkprotokolle brauche.

Output-Schemas machen Prompts operationalisierbar

Der größte Qualitätssprung entsteht oft nicht durch schönere Formulierungen, sondern durch ein klares Ausgabeformat. Wenn eine KI-Antwort in einem Menschen-Review landet, reicht Markdown häufig. Wenn sie in ein Tool, eine Pipeline, ein Ticket-System oder einen weiteren Agenten geht, braucht sie ein Schema.

Ein Output-Schema beschreibt Felder, Typen, Pflichtangaben und erlaubte Werte. Dadurch kann ich automatisch prüfen, ob die Antwort nutzbar ist. Das ist ein entscheidender Unterschied: Ich bewerte nicht mehr nur, ob eine Antwort plausibel klingt, sondern ob sie formal weiterverarbeitet werden kann.

Praktischer Effekt: Ein Schema verschiebt Qualitätssicherung nach vorne. Das Modell bekommt nicht nur eine Aufgabe, sondern auch eine Zielstruktur. Fehler werden früher sichtbar.

Validierung gehört zum Prompt dazu

Strukturierte Prompts sind am stärksten, wenn sie nicht beim Prompt enden. Die Kette sollte so aussehen: Prompt strukturieren, Beispiele ergänzen, Schema fordern, Modell ausführen, Ausgabe validieren, nur bei Fehlern iterieren.

Visualisierung: Pipeline von Prompt strukturieren über Beispiele, Ausgabe-Schema, Modell ausführen und Ausgabe validieren bis zum akzeptierten Ergebnis mit Rückschleife bei Fehlern. — Gute Prompts sind Teil eines Kontrollflusses. Entscheidend ist nicht nur die Eingabe, sondern auch die Prüfung der Ausgabe.

Das ist besonders wichtig bei Agenten. Ein Chat kann nachfragen. Ein Agent handelt. Je stärker ein Ergebnis downstream verwendet wird, desto weniger darf ich mich auf Bauchgefühl verlassen. Dann brauche ich Akzeptanzkriterien, Schemas, Tests oder explizite Review-Punkte.

Wie ich strukturierte Prompts im Alltag nutze

Ich beginne selten mit einer perfekten Vorlage. Meist schreibe ich erst die Aufgabe in einem Satz und zerlege sie dann: Was ist die Rolle? Was ist die eine konkrete Aufgabe? Welcher Kontext ist wirklich relevant? Welche Grenzen dürfen nicht überschritten werden? Wie soll das Ergebnis aussehen?

Wenn die Aufgabe wiederkehrt, mache ich daraus ein Pattern. Ein Review-Prompt bekommt eine feste Struktur. Ein Refactoring-Prompt bekommt negative Beispiele. Ein Recherche-Prompt bekommt Quellenanforderungen und Ausgabeformat. Ein Coding-Prompt bekommt Test- und Scope-Grenzen. So entsteht nach und nach eine kleine Bibliothek aus Prompts, die nicht spektakulär aussieht, aber zuverlässig Arbeit spart.

Der eigentliche Punkt: weniger Magie, mehr Engineering

Strukturierte Prompts sind kein Ersatz für Spezifikationen, Tests oder Architekturentscheidungen. Sie sind die Verbindungsschicht zwischen diesen Dingen und dem Modell. Je ernster ich KI-Coding nehme, desto weniger behandle ich Prompts als spontane Eingaben. Ich behandle sie als Artefakte: versionierbar, verbesserbar, überprüfbar.

Das verändert auch die Haltung. Ich frage nicht: „Wie bringe ich das Modell dazu, irgendwie die richtige Antwort zu geben?“ Ich frage: „Welche Struktur braucht die Aufgabe, damit ein Modell zuverlässig arbeiten und ich das Ergebnis sauber prüfen kann?“

Für mich ist genau das der Übergang von Prompting als Spielerei zu Prompting als Engineering-Praxis.

Weiterführende Quellen

Prompt Engineering KI-Coding RTCC Structured Outputs Prompt-Patterns