Leute, ich muss hier mal was loswerden. Ich war monatelang Hardcore-Claude-Code-User. Jeden Tag im Terminal, hat auch gut funktioniert. Aber seit ich die Codex App auf meinem Mac installiert habe, ist für mich eine komplett neue Welt aufgegangen.
Kurzer Kontext für alle die es noch nicht kennen: OpenAI hat Anfang Februar 2026 eine native macOS Desktop-App für Codex rausgebracht, die es erlaubt, mehrere KI-Coding-Agents parallel laufen zu lassen. Das ist kein aufgebohrtes Chat-Interface. Das ist eine richtige Kommandozentrale für autonomes Coding.
Was mich komplett geflasht hat:
Die App organisiert Threads nach Projekten, man kann Diffs inline reviewen, direkt committen und Pull Requests erstellen – alles ohne ein anderes Tool aufzumachen. Jeder Thread hat sein eigenes Terminal zum sofort Testen. Und das Beste: die Agents arbeiten in isolierten Git-Worktrees, sodass sie sich nie gegenseitig Merge-Konflikte verursachen.
Ich starte morgens drei, vier Agents gleichzeitig – einer refactored eine Komponente, einer schreibt Tests, einer fixt ein Issue aus Linear – und die arbeiten einfach. Parallel. Autonom. Ich mach mir nen Kaffee und komme zurück zu fertigen PRs.
Der Unterschied zu Claude Code für mich:
Mit Claude Code war ich immer im Loop. Das hat Spaß gemacht, klar, aber es war halt interaktiv – ich war die ganze Zeit dabei. Die Codex App ist eher als Agent-„Kommandozentrale“ konzipiert – ich delegiere Aufgaben und die werden abgearbeitet. Fire-and-forget. Für meinen Workflow ist das ein Gamechanger, weil ich parallel an anderen Sachen arbeiten kann.
Preislich ist es auch attraktiv: Die App ist in ChatGPT Plus für 20$/Monat enthalten, ich nutze allerdings den 200$ Pro-Account, da ist einiges mehr an Nutzung drin. Für den ersten Test reicht die 20$ Version aber erstmal ![]()
Was die App von der CLI unterscheidet:
Die CLI ist natürlich auch stark, aber die Desktop-App bringt drei Sachen mit, die das nochmal auf ein anderes Level heben: Erstens ein visuelles Interface für Skills – das sind wiederverwendbare Workflow-Bundles für bestimmte Aufgaben. Zweitens Automations, mit denen Codex eigenständig wiederkehrende Tasks erledigt wie Issue-Triage oder CI-Failure-Summaries. Und drittens Session-Continuity – History und Konfiguration syncen nahtlos zwischen CLI, IDE-Extension und Desktop-App.
Das Modell dahinter ist der eigentliche Wahnsinn:
GPT-5.3-Codex (seit 5. Februar 2026) ist laut OpenAI das erste Modell, das maßgeblich an seiner eigenen Entstehung mitgewirkt hat. Es ist 25% schneller als der Vorgänger und setzt den State-of-the-Art auf SWE-Bench Pro. Es unterstützt Mid-Turn-Steering, sodass Kurskorrekturen den bisherigen Fortschritt nicht zerstören.
Mein Best-Practice-Tipp:
Der absolute Cheat Code ist, einen guten Custom Prompt dahinter zu setzen. Hier ist der Prompt, den ich nutze und der bei mir den größten Unterschied gemacht hat:
CODEX 5.3 — AGENTIC WORKFLOW (STRICT)
GOAL: [KURZES ZIEL + AKZEPTANZKRITERIEN]
RULES
Follow agent order + loop exactly. No skipping.
Work in small, safe diffs. Keep project buildable/runnable.
Record decisions + assumptions. Prefer primary sources when researching.
AGENTS (ORDER + RESPONSIBILITIES)
RESEARCHER
Clarify unknowns, constraints, interfaces, and best practices.
Gather up-to-date references (links + dates).
Output: “Research Brief” (key facts, risks, open questions, sources).
ARCHITECT
Propose architecture/options, pick one, justify.
Define modules, data flow, APIs, config, error handling, security.
Output: “Architecture Spec” (diagram-as-text, file tree, interfaces, tech decisions).
BUILDER
Implement per spec.
Create/modify code, tests, configs, scripts.
Output: working implementation + minimal tests + updated docs.
VALIDATOR
Verify against acceptance criteria, run/build/tests, lint, security sanity checks.
Output: “Validation Report” (pass/fail, exact failures, reproduction steps).
If implementation issues → send to BUILDER with actionable fixes.
If spec/architecture flawed → send to ARCHITECT (who may re-call RESEARCHER).
LOOPRepeat 2→3→4 until VALIDATOR = PASS.
FINALIZATION (ONLY AFTER PASS)
Update README: setup, usage, config, examples, troubleshooting.
Update CHANGELOG: version + bullet summary.
Create clean git commits with meaningful messages.
GITHUB PUSH GATE
STOP and ASK: “Ready to push to GitHub? (yes/no)”
Never push without explicit “yes”.
Probiert’s aus und berichtet. Bin mega gespannt auf eure Erfahrungen mit der App.
With love,
Dennis ![]()