Mit GenKI4Media entsteht eine Plattform für KI-Assistenten und Plug-ins zur Automatisierung von Prozessen.

Die neuen KI-Assistenten werden dem Mittelstand ermöglichen, Geschäftsprozesse durch Generative KI zu optimieren, neue Services anzubieten und das eigene Know-how rund um KI zu erweitern. Die Assistenten bieten unter anderem in folgenden Feldern Unterstützung:

Gegenüber vorhandenen Tools bietet GenKI4Media Nutzenden wertvolle Innovationen:

Die KI-Assistenten werden anfangs durch Workflows, Keywords, Materialien und Zielgruppe konfiguriert und trainiert, sodass ein Assistent für jeweils eine Domäne und eine Aufgabenstellung erzeugt wird – ohne dass jeder Anwendungsfall neu implementiert werden muss.

Generell bringt die Fokussierung auf eine Domäne und Aufgabenstellung große Arbeitserleichterung: Mittels Input von multimodalen Dokumenten, Aufgabenstellungen, Zielgruppen und erwarteten Ergebnissen ermöglichen die KI-Assistenten, einen breiten Bereich von Aufgaben effizient und mit hoher Qualität zu lösen.

Arbeitsweise der Assistenten

Redaktionen können beispielsweise den Assistenten für „Standards und Regelungen“ selbst einrichten, um Medienkonformität zu gewährleisten und Verstöße gegen den Digital Service Act (DSA) automatisiert aufzuspüren.
Dazu wird der Assistent für die zu identifizierenden kritischen Inhalten konfiguriert (z.B. Diskriminierung), mit Material für Problemfälle, kritischen Schwellwerten, benötigten Berichten und Gesetzen trainiert. Nach Abschluss des Trainings erledigt er die geforderte Aufgabe für eine konkrete Redaktion weitgehend automatisch.

Zur automatischen Abarbeitung einer Aufgabenstellung geht der Assistent schrittweise vor: Er stellt eine Folge von Anfragen an die Schnittstelle des LLM-Frameworks, verarbeitet die zurückgelieferten Ergebnisse mit KI-Methoden, um dann weitere Anfragen zu stellen – so lange, bis daraus ein Ergebnis-Dokument, eine Website oder Anwendung generiert werden kann.
Nach der enthaltenen Ablauflogik entsteht mit dem Assistenten sozusagen eine Meta-Anwendung, die Anwendungen konkret und zielgenau generieren kann. So genügt es, wenn der Anwendende z.B. per Text eingibt, was er haben möchte. Der Assistent erstellt dann für diese Domäne die benötigten Medien, Websites oder einen Demonstrator. Als Human-in-the-loop lassen sich die neuen Mechanismen im Generierungsprozess und im Produktivbetrieb zur Darstellung der Vertrauenswürdigkeit und Transparenz nutzen, um Qualität und Richtigkeit der generierten Inhalte sicherzustellen.

GenKI-Assistenten und LLM-Plug-Ins

GenKI-Assistenten

Der Assistent zur Generierung multimodaler Medienformate für Kultur, Politik, Bildung unterstützt Redaktionen verschiedener Zielgruppen bei der Erstellung qualitativ hochwertiger, multimodaler Content-Bausteine (Text, Bild, Audio, Video) für seriöse Informations- und Bildungsangebote im Web. Beispiele könnten multimodale interaktive Dossiers zu aktuellen Themen wie Bundestagswahl, Migration oder Klimawandel sein.

Mit GenKI-Methoden lassen sich hybride interne und externe Datenbestände auf neue Weise für die Informationsaufbereitung nutzen: Schon bei der Recherche unterstützen fortgeschrittene Ähnlichkeitssuchen. Anschließend können multimodale Content-Bausteine unter Angabe seriöser Quellen präzise auf verschiedene Web-Formate wie Websites und Social Media zugeschnitten werden.

Der Assistent führt so zur Generierung eines breiteren und effizienter erstellten Format-Portfolios.

Der Assistent zu Standards und Regelungen im Medienbereich unterstützt Unternehmen bei der Umsetzung von immer neuen oder sich ändernden Regelungen zu Bereichen wie Datenschutz, Diskriminierung, Lieferketten oder Klimaschutz. Vorrangig geht es dabei um die Einhaltung des DSA (Digital Services Act) und der Richtlinien des AI-Acts: Diese verpflichten Anbieter digitaler Dienste zum Monitoring von Text, Bild und Videos und regelmäßigem Reporting. Unter anderem wird die GenKI Diskriminierung, Bias, illegale Inhalte, Dark Pattern oder zielgerichtete Werbung erkennen, sie bewerten und validieren. Parallel erstellt sie Berichte, Zusammenfassungen und Begründungen mit Referenzen zu den jeweils zugrundeliegenden Gesetzen.

Die herkömmlichen Methoden können z.B. aus den zahllosen Webinhalten über Drogen nur sehr begrenzt herausfinden, welche 2% der Inhalte wirklich auf illegale Aktivitäten hinweisen. Dank GenKI kann der Assistent feingranular einordnen, ob Inhalte tatsächlich eine kritische Schwelle überschreiten und ein relevanter illegaler Kontext vorliegt, selbst wenn die gesuchten Begriffe selber gar nicht genannt sind.

Transparenz bezüglich der Glaubwürdigkeit entsteht durch die zugrundeliegenden Argumentationsketten und Quellen, so dass Redaktionen schrittweise kritische Inhalte durchleuchten, analysieren und bewerten können.

Der Assistent zur Generierung von Demonstratoren für den Kreativ-/Kulturbereich erlaubt die Erstellung visueller Demonstratoren basierend auf generierten 3D-Assets und Szenarien sowie abstrakten Datenvisualisierungen. Auch Skizzen für frühe Konzept- oder Pitchphasen lassen sich so generieren – ein großer Vorteil für die Kreativwirtschaft und verwandten Branchen wie Architektur, Events und Kultur. Beispiele hierfür wären Modelle für ein visionäres Bauprojekt oder die schnelle 3D-Visualisierung zur besseren Vermittlung komplexer Sachverhalte (z.B. für journalistische Recherchen).

Auf Basis von GenKI-Methoden können sowohl statische 2D-Visualisierungen erzeugt werden als auch 3D-Assets, die für immersive VR/AR/MR Umgebungen einsetzbar sind. Diese erhöhen durch zielgruppengerechte visuelle und/oder textliche Ansprache von Nutzenden die Qualität einer nachhaltigen und zugleich der Barrierefreie-Informationstechnik-Verordnung (BITV) entsprechenden Inhalts-Vermittlung.

LLM-Plug-ins

Neue Plug-ins zur Wissensorganisation ergänzen LLMs durch die Nutzung von symbolischem, regelbasierten Wissen: Sie identifizieren Falschinformationen in den zum Fine Tuning verwendeten Trainingsdokumenten und Prompts, weisen Nutzende auf Fehler hin oder unterbreiten Korrekturvorschläge.
Dabei kommt symbolisches Wissen beim Generierungsprozess zum Einsatz (Guided LLM), die Ableitung strukturierter Informationen wird mittels Grammatiken verbessert und Überprüfung resp. Steuerung der Textgenerierung reduziert Falschinformationen. Ziel ist, die inhaltliche Korrektheit von generierten Texten und die Ableitung und Aggregation von Wissen und Informationen für das unternehmensinterne Wissensmanagement zu sichern.

Anwendende profitieren von qualitativ hochwertigen, kontextuell zugeschnittenen Antworten durch ein neuartiges, die Terminologie des Anwendungsgebiets berücksichtigendes Retrieval Augmented Generation-System (RAG), das auf einem neuartigen “Semantic Information Retrieval” basiert.

Das Plug-in zu Transparenz und Vertrauen adressiert Defizite von KI-Sprachmodellen: Oft sind Entscheidungen der KI wenig transparent, Schlussfolgerungen nicht konsistent oder nachvollziehbar, dazu kommt sprachlich-inhaltlicher Modell- und Daten-Bias.
In GenKI4Media werden Redaktionen, Gutachtende oder Endnutzende in die Erstellung und Verarbeitungsschleife der KI einbezogen. Dies ermöglicht, den Domänenkontext feiner zu konfigurieren, sichere externe und interne Quellen zu unterscheiden sowie Argumentationsketten durch Reasoning im Branchenkontext überprüfbar zu machen.

Neue Methoden erklärbarer KI (XAI) dienen der multimodalen dialogischen Erklärbarkeit sowie neuro-symbolische Ansätze der transparenten Quellen-Attribution und faktischen Validierung generierter Texte. Zur Validierung und Prüfung existierender Modelle werden domänenspezifische Contrast- bzw. Challenge-Sets entwickelt, die kritische Fälle in realen Anwendungsszenarien prüfen.

Synergie von symbolischer KI und LLMs

Die Innovation von GenKI4Media besteht in der kooperativen Kombination der symbolischen KI-Ansätze mit den dialogischen Vertrauens- und Attributions-Mechanismen sowie deren Integration mit LLMs. Die Verarbeitungsprozesse der KI-Komponenten werden dabei in Abhängigkeit von den Anforderungen der KMU- und Anwendungspartner realisiert. Es lassen sich obligatorische Prozesse (durchgezogene Pfeile) und optionale Prozesse (gestrichelte Pfeile) unterscheiden.