Notes from - Every - The Eight Levels of AI Adoption (Mike Taylor & Laura Entis)

Quelle

Kurzfassung (eigene Worte)

Mike Taylor und Laura Entis (Every) ordnen KI-Nutzung in acht Stufen — von einfachem Chatbot bis zur Orchestrierung mehrerer Agenten. Entscheidend: Höhere Stufe ≠ besser. Mit jeder Stufe delegierst du mehr Arbeit und Vertrauen an die KI. Die passende Stufe hängt von Vertrauen, Einsatzrisiko und Rolle ab.

Für die meisten Wissensarbeiter liegt der Sweet Spot zwischen Stufe 1 und 4. Ingenieure operieren häufiger auf Stufe 5–8, weil sie die Gerüste bauen, die neuere Systeme erst benutzbar machen. Wer KI „nicht annimmt“, hat oft gute Gründe: Output-Qualität zu niedrig oder Kosten zu hoch für den Nutzen.

Kernbotschaft: KI-Nutzung ist kein Wettbewerb. Vertrauen wächst wie bei Praktikanten — erst enge Begleitung, dann mehr Autonomie. Regelmäßig prüfen, ob die aktuelle Stufe noch passt; Modell-Releases können früher unzugängliche Stufen plötzlich sinnvoll machen.


Die 8 Stufen im Detail

Stufe 1 — Chatbot

Was: Du fragst, das Modell antwortet. Klassische Chat-Oberfläche (ChatGPT, Claude, Gemini) ohne Einbettung in Dateien oder Systeme.

Was sich ändert: Du wechselst vom „alles selbst machen“ zu Entwürfen und Synthese mit einem immer verfügbaren KI-Generalisten.

Typische Einsätze: E-Mails aus Stichpunkten, Dokumente zusammenfassen, Fragen zu hochgeladenen PDFs beantworten.

Beispiel-Prompt: Meeting-Notizen → Follow-up-E-Mail in ruhigem Ton, drei klare Next Steps; Modell soll fehlende Infos vor dem Schreiben melden.

Wann hoch: Wenn Chatbots viel Wert liefern, aber Copy-Paste und manuelles Kontext-Setup nerven.


Stufe 2 — Copilot

Was: Das Modell sitzt in deiner Arbeitsumgebung (Cursor, Claude in Excel, Gemini in Docs) und sieht den aktuellen Kontext der Datei/des Workspaces.

Was sich ändert: KI ist kein separater Tab mehr, sondern ein In-Place-Mitarbeiter, der mitliest und mitarbeitet.

Typische Einsätze: Entwürfe fortsetzen, Dokumentensätze verstehen ohne alles in den Chat zu pasten, Tabellen live anpassen.

Beispiel-Prompt: „Schreibe die nächsten zwei Abschnitte im gleichen Ton wie der bestehende Entwurf; markiere Stellen, wo du Beispiele von mir brauchst.“

Wann hoch: Wenn Informationen aus mehreren Quellen gezogen, kompiliert oder analysiert werden müssen — Copilot reicht meist nur für eine Datei.


Stufe 3 — Agent

Was: Du beschreibst eine Aufgabe; der Agent arbeitet schrittweise und holt zwischenzeitlich deine Freigabe ein. Er kann Dateien, Systeme und mehrere Quellen nutzen — ist aber reaktiv (startet nur auf explizite Anweisung).

Was sich ändert: KI wird zum Operator für mehrstufige Aufgaben unter Aufsicht.

Typische Einsätze: Zahlen aus einer Datei in eine andere übertragen, Dashboard aus Quelldaten bauen, Board-Deck aus Spreadsheet aktualisieren — jeweils mit Slide-für-Slide-Review.

Beispiel-Prompt: Q4-Zahlen ins Board-Deck; vorgeschlagene Änderungen pro Slide zeigen, bevor etwas angewendet wird.

Wann hoch: Wenn der iterative Review-Zyklus zu langsam ist und du Geschwindigkeit oder One-Shot-Prototypen willst.


Stufe 4 — Autopilot

Was: Du überspringst Zwischenfreigaben; der Agent erledigt die Aufgabe allein, du prüfst das Endergebnis. Oft „Vibe Coding“ — du beschreibst das Ziel, lässt laufen, bewertest Output.

Was sich ändert: Du übergibst die gesamte Aufgabe und reviewst am Ende statt unterwegs.

Typische Einsätze: Prototypen, interne Tools, Landing Pages, wiederkehrende Formulare oder Statusberichte — Dinge, die andere nutzen können, ohne dass du Code schreibst.

Grenze: Was auf Autopilot geht, hängt von Modellfähigkeit ab (Landing Page ja, komplexes Slide Deck oft noch nein).

Beispiel-Prompt: „Baue ein internes Lead-Scoring-Tool mit Dummy-Daten, demo-fähig bis morgen.“

Wann hoch: Wenn Autopilot schnell, aber uneinheitlich liefert — du willst die Geschwindigkeit mit strukturierter Qualitätskontrolle.


Stufe 5 — Workflows

Was: Du baust ein System/Harness um den Agenten: Plan → Review → Confidence-Checks → Safeguards. Übergang von Vibe Coding zu agentic engineering. Erfordert meist technisches Urteilsvermögen.

Was sich ändert: Der Agent ist kein One-Shot-Performer mehr; ein wiederholbarer Prozess kodiert deine Standards.

Typische Einsätze: Features mit Plan-Review-Implement-Schleife shippen, Vibe-Prototyp production-tauglich machen, Team-Prozesse, die andere Ingenieure folgen können.

Beispiele: /ce-plan vor Code; danach /ce-code-review mit Confidence-Score >90 oder begründeter Abweichung.

Wann hoch: Wenn du Workflows aktivieren musst — für manche Bereiche willst du proaktive Hilfe ohne jedes Mal zu starten.


Stufe 6 — Assistant

Was: Im Gegensatz zum reaktiven Agenten handelt der Assistant proaktiv im Hintergrund — ohne Prompt. Überwacht Domänen, erledigt wiederkehrende Arbeit, liefert laufend Briefings (z. B. OpenClaw heartbeat.md alle 30 Min.).

Was sich ändert: KI wird von reaktiver Hilfe zu dauerhafter, proaktiver Unterstützung.

Typische Einsätze: Wiederkehrende Recherche, Themen-Monitoring, persönliche Admin-Aufgaben, die sonst untergehen.

Einschränkung: Setup und Wartung brauchen technisches Know-how; Memory zwischen Sessions ist noch schwach; niedrige Risiko-Personal-Use-Cases (Schule, Haushalt) sind zugänglicher als voller Work-System-Zugriff.

Beispiel: Alle 30 Min. Kalender prüfen, Meetings ohne Agenda flaggen und Agenda-Vorschlag draften.

Wann hoch: Wenn ein Assistant gut läuft, du aber mehr parallele Kapazität willst, ohne einen laufenden Agenten zu unterbrechen.


Stufe 7 — Multi-Agent

Was: Du führst mehrere long-running Agents parallel — jeder mit Rolle, Aufgabe oder Verantwortungsbereich. Deine Arbeit gleicht Teamleitung.

Was sich ändert: Produktivität skaliert von einem Agenten zu paralleler Arbeit mehrerer Spezialisten.

Typische Einsätze: Implementation und Planung gleichzeitig; wiederkehrende Investigation automatisiert; zweiter Agent für Support-Inbox, während der erste Editorial macht — getrennte Kontexte/Memory.

Human judgment: PRs reviewen, mergen, Fehldiagnosen erkennen; Job-Beschreibungen der Agenten schärfen, wenn Memory überladen wird.

Wann hoch: Wenn du so viele parallele Agenten hast, dass du den Überblick verlierst, wer wofür zuständig ist.


Stufe 8 — Orchestrator

Was: Ein Manager-Agent plant, delegiert, überwacht Fortschritt und konsolidiert Outputs. Du setzt Ziele, Constraints und Freigabe-Schwellen — nicht jeden Einzelagenten. Beispiele: Gas Town, Paperclip, Symphony (OpenAI). Hochexperimentell; Frontier-Engineers sind oft selbst noch der Orchestrator.

Was sich ändert: Du verwaltest nicht mehr jeden Agent einzeln, sondern Systemziele und Eskalationsregeln.

Typische Einsätze: Ticket-Queue abarbeiten lassen (Research parallel, Brand-Skill, fertiges Projekt zur Human-Review); Code-Pipeline mit Tests, Standards-Check, Eskalation nur bei Urteilsfragen.

Human judgment: Ob der Orchestrator richtig triagiert — zu viele oder zu wenige Items an dich.


Was die Stufen messen (Meta)

StufeKurz
1 ChatbotFragen → Antwort
2 CopilotKI im Dokument/Editor
3 AgentMehrstufig, mit Freigaben
4 AutopilotEnd-to-end, Ergebnis-Review
5 WorkflowsHarness, Plan/Review-Loops
6 AssistantProaktiv, ungefragt
7 Multi-AgentParallele Spezial-Agenten
8 OrchestratorManager-Agent über Team

Kein Werturteil: Die meisten brauchen keine Orchestrierung — Modelle sind dafür oft noch nicht zuverlässig genug. Modell-Verbesserungen können frühere „zu hohe“ Stufen wieder erreichbar machen.


Persönliches Assessment — Auf welcher Stufe arbeite ich bereits?

Primäre Betriebsstufe: 5 (Workflows) — mit aktivem Einsatz von 2–4 und früher Exploration von 6–7.

Begründung

Stufe 2–3 (Copilot & Agent) — solide Basis, täglich

  • Cursor als eingebetteter Copilot im KI-Betriebssystem-Repo mit vollem Workspace-Kontext.
  • Agent-Modus mit schrittweiser Ausführung und Tool-Nutzung (Read, Shell, MCP) für konkrete Aufgaben wie diese Literature Note.

Stufe 4 (Autopilot) — selektiv bei 🟢-Governance

  • Process-Inbox: n8n klassifiziert Governance; bei grün läuft Cursor autonom durch, ohne Slide-für-Slide-Freigabe — Ergebnis-Review erst implizit nach Vollzug.
  • Landing-Page-ähnliche oder klar abgegrenzte Aufgaben werden „one-shot“ delegiert.

Stufe 5 (Workflows) — struktureller Kern des KI-Betriebssystems

  • Kanonische SOPs (sop-deep), KAIROS-Skill-Parität, Validatoren, Compound-Engineering-Skills (/ce-plan, Code-Review-Personas).
  • n8n-Pilot mit definiertem State-Model (webhook → governance → execute → close).
  • Governance-Ampel (🟢/🟡/🔴), Security-Regeln für untrusted Webhook-Input, Observability (system_log.md).
  • Das ist genau der Übergang von „Vibe“ zu agentic engineering mit Guardrails.

Stufe 6 (Assistant) — angefangen, nicht durchgängig

  • Proaktive Elemente: Todoist-Webhook-Listener, Launchd-Runtime, System-Heartbeat, n8n-Trigger ohne manuellen Chat-Start.
  • Aber: kein durchgängiger OpenClaw-artiger Personal Assistant für Kalender, Inbox, Haushalt; Wartung und Stabilität noch manuell; Memory über Sessions hinweg begrenzt.

Stufe 7 (Multi-Agent) — punktuell

  • Parallel: KAIROS-MCP + Cursor-Agent + n8n + Compound-Subagenten (Review-Personas).
  • Kein dauerhaftes Setup mehrerer isolierter Long-Running-Agenten mit klaren Job Descriptions auf eigenen Maschinen.

Stufe 8 (Orchestrator) — bewusst nicht Primärfokus

  • n8n orchestriert Governance und Dispatch, aber ich bin noch der Manager — kein autonomer Orchestrator-Agent, der ein Agenten-Team selbstständig steuert (Gas-Town-Niveau).

Praktische Konsequenz

Passend zum Artikel: mehrere Stufen gleichzeitig, je nach Risiko und Aufgabe.

  • Hohe Stakes / PKMS-Inhalte / Kundenkontext → eher 3–5 mit Review.
  • Klar abgegrenzte 🟢-Automation → 4–5.
  • Nächster sinnvoller Hebel: Stufe 6 ausbauen (Heartbeat/Assistent für niedrig-riskante wiederkehrende Domänen), ohne Stufe 8 vorzeitig zu erzwingen.

Verknüpfungen & Bezüge