Deus in machina: Wie KI-Agenten kreative Arbeiten in den Medien übernehmen

Das Bild ist im Kasten, der Text fertig, die Idee visualisiert – und dann beginnt oft die eigentliche Plackerei. Das Aufbereiten von Text- und Bild-Inhalten für unzählige Kanäle, die Keyword-Recherche, das Verfassen von zusätzlichen Begleittexten und das mühsame Bespielen von Plattformen sind zeitraubende Aufgaben, die mit dem kreativen Akt an sich wenig gemein haben. Genau in diese Lücke zwischen schöpferischem Impuls und strategischer Verwertung stößt nun eine Technologie, die weit mehr ist als nur ein weiteres Werkzeug: der (teil-)autonome KI-Agent. Er verspricht, ganze Prozessketten zu steuern, von der Recherche bis zur Distribution. Doch was bedeutet es für die professionelle Medienproduktion wenn der Mensch nicht mehr Pilot, sondern nur noch ein Passagier ist, der eine Reise bucht? Oder wird er Spieler ein oder mehrerer Instrumente zum Dirigenten eines digitalen Orchesters?

Vom Werkzeug zum proaktiven Partner

Anders als bisherige KI-Anwendungen, die reaktiv auf einen Befehl warten, agieren Agenten proaktiv. Sie erhalten ein übergeordnetes Ziel und zerlegen die Aufgabe selbstständig in logische Einzelschritte, die sie nacheinander abarbeiten. Dabei greifen sie auf externe Werkzeuge und Datenquellen zu, lernen aus Rückmeldungen und passen ihre Strategie dynamisch an. Diese Systeme markieren den Übergang vom assistierenden „Copilot“-Modell zu einer neuen Arbeitsweise, bei der der Kreative die Rolle des Impulsgebers und strategischen Kontrolleurs einnimmt. Er definiert das „Was“ und das „Warum“, während der Agent sich weitgehend autonom um das „Wie“ kümmert.

Einblicke in die automatisierte Redaktion

Was abstrakt klingt, wird in der Praxis bereits erprobt. Für den digitalen Jahresrückblick durchforstete bei der Süddeutschen Zeitung ein Agenten-System über 60.000 Artikel samt Bildern und Videos. Die KI las nicht nur die Texte, sondern erkannte auch visuelle Muster in den Fotografien, identifizierte wiederkehrende Motive und sortierte sie thematisch. Das Ergebnis war keine simple Aufzählung, sondern eine interaktive Erzählung, angereichert mit passenden Archivbildern, die der Algorithmus selbstständig aus dem riesigen Fundus des Redaktionsarchivs auswählte. Das Verfahren nennt sich „Retrieval-Augmented Generation“ – ein sperriger Begriff, der die elegante Funktionsweise kaum erahnen lässt.

Doch dieses Beispiel kratzt nur an der Oberfläche dessen, was agentische KI zu leisten vermag. Stellen wir uns einen fiktiven Anwendungsfall vor, der die potenziellen Fähigkeiten voll ausschöpft: Eine Redakteurin beauftragt einen KI-Agenten mit der Ausarbeitung einer umfassenden visuellen Reportage über die architektonische Transformation eines Stadtteils in den letzten 20 Jahren. Der Auftrag lautet nicht „Schreibe einen Text“, sondern „Produziere eine Multimedia-Story über die Gentrifizierung in Berlin-Neukölln, inklusive interaktiver Karte, einer 90-Sekunden-Videodokumentation für Social Media und einer statischen Infografik für Print.“ Der Agent beginnt nun autonom zu arbeiten.

1. Recherche und Analyse:
Er greift auf städtische Baudatenbanken zu, analysiert Mietspiegel-Entwicklungen, durchsucht Zeitungsarchive nach Schlüsselartikeln und identifiziert über Bilderkennung die markantesten architektonischen Veränderungen im definierten Gebiet. Er erkennt Muster und identifiziert die Hotspots der Veränderung.

2. Narrative Strukturierung:
Basierend auf den Daten schlägt der Agent eine Dramaturgie vor: „Vom Arbeiterviertel zum Hipster-Hotspot – eine visuelle Zeitreise“. Er erstellt ein Storyboard für das Video und eine Gliederung für den Longread.

3. Multimodale Asset-Produktion:
Der Agent orchestriert nun verschiedene Werkzeuge. Er durchsucht Bildagenturen nach historischen Fotos der identifizierten Hotspots. Gleichzeitig generiert er mit einem Bild-Tool illustrative Grafiken im Stil von Architekturzeichnungen für Aspekte, zu denen kein Bildmaterial existiert. Für die interaktive Karte visualisiert er die Mietpreisentwicklung. Aus den Rechercheergebnissen und dem Storyboard synthetisiert er ein Skript für das Video, generiert eine synthetische Sprecherstimme und schneidet historisches Material mit animierten Daten zu einem fertigen Clip zusammen.

4. Präsentation und Iteration:
Schließlich präsentiert der Agent der Redakteurin die fertigen Produkte: den interaktiven Artikel, das Video und die Infografik. Die Redakteurin gibt Feedback: „Die Musik im Video ist zu dramatisch, und die Infografik braucht mehr Fokus auf den Verlust von Sozialwohnungen.“ Der Agent versteht die Kritik, sucht eine neue Musik aus, passt die Datengewichtung in der Grafik an und liefert eine überarbeitete Version.

In diesem Szenario agiert der Agent nicht mehr als einzelnes Werkzeug, sondern als autonomer Produktionsleiter, der eine komplexe Aufgabe versteht, plant, verschiedene Spezialwerkzeuge koordiniert und auf Feedback reagiert. Die menschliche Rolle hat sich vollständig von der Ausführung zur strategischen Kuration und finalen Abnahme gewandelt. Aber, und das geht bei solchen Betrachtungen gerne verloren: Der Mensch, der den Auftrag erteilt, muss natürlich da Ergebnis in allen Details nachvollziehen können, bevor es veröffentlicht wird. Das hätte zuvor ein Team geleistet.

Die Tücken der neuen Effizienz

Die Verlockung der automatisierten Effizienz birgt also erhebliche Risiken. Neben der Richtigkeit der Fakten liegt – wenn die KI eines Tages tatsächlich fehlerfrei arbeiten –  die nächste Gefahr in der Homogenisierung der Inhalte. Was passiert, wenn Tausende von Anwendern auf dieselben KI-Agenten mit ähnlichen Datenpools und KI-Ästhetiken zurückgreifen? Das hätte dann etwas die Einheitlichkeit von dpa-Meldungen. Doch geht mit der vereinfachten Produktion der Inhalte absehbar eine Flut von technisch perfekten, aber seelenlosen Bildern und Videos ohne individuelle Handschrift oder wiedererkennbare Markenidentität einher. Adam Mosseri, der Chef von Instagram, warnte bereits vor einer Authentizitäts-Krise: Je besser die KI wird, desto einfacher lässt sich Authentizität künstlich reproduzieren und desto schwieriger wird es, massenhaft produzierten „KI-Schrott“ von wertvollen Inhalten zu unterscheiden.

Die Effizienz hat aber nicht nur ästhetische Tücken, sondern auch handfeste technische. Generative KI neigt bekanntlich immer noch zum „Halluzinieren“, also zum Erfinden plausibel klingender, aber falscher Informationen. Bei autonomen Agenten, die komplexe, mehrstufige Aufgaben abarbeiten, potenziert sich dieses Risiko: Ein Fehler in einer frühen Phase kann sich unbemerkt durch den gesamten Prozess ziehen und das Endergebnis verfälschen. Aus diesem Grund bleibt das Prinzip des „Human-in-the-Loop“ – also die Kontroll- und Entscheidungsinstanz des Menschen – unverzichtbar.

Die neue Rolle: Dirigent im Maschinenraum

Die Rolle des Medienschaffenden wird sich also zweifellos verändern. Der Fokus verschiebt sich von der reinen Ausführung hin zur Konzeption, Kuration und strategischen Steuerung. Der Erfolg wird künftig weniger davon abhängen, jedes Werkzeug bis ins Detail zu beherrschen, sondern vielmehr davon, die richtigen Fragen zu stellen und KI-Agenten gezielt zu orchestrieren, um eine kreative Vision umzusetzen. Die Fähigkeit, Neugier in strukturierte, komplexe Aufträge für eine Maschine zu übersetzen, wird zur Schlüsselkompetenz. Die Kluft zwischen Gelegenheitsnutzern, die KI wie eine bessere Suchmaschine behandeln, und „Power-Usern“, die ganze Agenten-Systeme dirigieren, wird wachsen. Der Autopilot mag die Routine übernehmen, doch die kreative Regie bleibt – hoffentlich – in menschlicher Hand.

Share the Post: