GenKI4Media Plattform
Plattform für KI-Assistenten und Plug-ins zur Automatisierung von Prozessen.
Die entstehenden KI-Assistenten werden dem Mittelstand ermöglichen, ihre Geschäftsprozesse durch GenKI zu optimieren, neue Services anzubieten und ihr KI Know-how zu erweitern. Dabei können die Assistenten vielseitig unterstützen, wie z.B. bei
- der Akquisition von Wissen: Recherche und Zusammenstellung von neuem Wissen aus verschiedenen, vorhandenen Quellen jeweils zugeschnitten auf die Aufgabenstellung und Randbedingungen der Redaktion
- der Bewertung aus verschiedenen Sichten: Bewertung und Klassifikation von Inhalten hinsichtlich verschiedener Aspekte wie Qualität, Glaubwürdigkeit, Innovation, Positiv/Negativ oder Emotionen wie Hass, Freude, Abscheu, Glück, Ekel etc.
- der automatischen Abwicklung von Prozessen: Verarbeitung von Aufgabenstellungen in mehreren Schritten mit den jeweiligen Arbeiten, Beteiligten und Auswirkungen sowie
- dem kreativen Entwurf neuer Visionen: Aufzeigen der möglichen Optionen für eine konkrete Aufgabenstellung mit den jeweiligen Konsequenzen sowie Vor- und Nachteilen.
Der entstehende Nutzen besteht darin, dass nicht mehr jeder Anwendungsfall manuell neu implementiert werden muss, sondern die neuen KI-Assistenten lediglich durch Workflows, Keywords, Materialien und Zielgruppe konfiguriert und trainiert werden, so dass ein Assistent für eine Domäne und eine Aufgabenstellung erzeugt wird. So sollen z.B. Medienredaktionen den Assistent für „Standards und Regelungen“ für den Bereich Medienkonformität zum Auffinden von Verstößen gegen den DSA selbst einrichten können. Durch Konfigurieren mit: zu identifizierende kritische Inhalte (wie z.b. Diskriminierung), Trainingsmaterial für Problemfälle, kritische Schwellwerte, benötige Berichte und betroffene Gesetze, kann dann ein generativer Assistent erzeugt werden, der diese Aufgabe für einen konkreten Redakteur weitgehend automatisch erledigt.
Zur automatischen Abarbeitung einer Aufgabenstellung stellt der Assistent eine Folge von Anfragen an das API des LLM-Frameworks, verarbeitet die zurückgelieferten Ergebnisse mit KI-Methoden, um dann weitere Anfragen zu stellen, bis daraus schließlich ein resultierendes Dokument, Website oder eine Anwendung generiert werden kann. Da diese auch Ablauflogik enthalten können, entsteht mit dem Assistenten sozusagen eine Meta-Anwendung, die Anwendungen zielgenau für konkrete Domänen generieren kann. Das Ziel ist, dass der Anwendende z.B. textuell eingibt, was er haben möchte, und der Assistent dann für diese Domäne die benötigten Medien, Websites oder einen Demonstrator generiert. Ein Redakteur mit Expertise als Human-in-the-loop kann im Generierungsprozess und im Produktivbetrieb die neuen Mechanismen zur Darstellung der Vertrauenswürdigkeit und Transparenz nutzen, um Qualität und Richtigkeit der generierten Inhalte sicherzustellen.
Durch die Fokussierung auf eine Domäne und Aufgabenstellung wird es möglich, dass die GenKI-Assistenten mittels Input von multi-modalen Dokumenten, Aufgabenstellungen, Zielgruppen und erwarteten Ergebnissen Anwendungen bereitstellen, die einen breiten Bereich von Aufgaben effizient mit hoher Qualität lösen können.
GenKI-Assistenten
Der Assistent zur Generierung multimodaler Medienformate für Kultur, Politik, Bildung unterstützt Redaktionen verschiedener Zielgruppen bei der Erstellung qualitativ hochwertiger, multimodaler (Text, Bild) Content-Bausteine für seriöse Informations- und Bildungsangebote im Web. Ein Beispiel könnte die Generierung eines multimodalen interaktiven Dossiers zu aktuellen Themen wie Bundestagswahl, Migration oder Klimawandel sein. Mit GenKI-Methoden lassen sich hybride interne und externe Datenbestände von Redaktionen auf neue Weise für die Informationsaufbereitung nutzen. Fortgeschrittene Ähnlichkeitssuchen unterstützen bereits bei der Recherche, anschließend können multimodale Content-Bausteine unter Angabe seriöser Quellen präzise für verschiedenen Web-Formate wie Webseiten und Social Media generiert werden. Der Assistent führt somit zu einem breiteren und effizienteren Lösungs-Portfolio von KMUs.
Der Assistent zu Standards und Regelungen im Medienbereich soll Unternehmen bei der Bearbeitung von immer neuen oder sich ändernden Regelungen zum Datenschutz, Diskriminierung, Lieferketten oder Klimaschutz unterstützen. Das Projekt wird sich vornehmlich auf die Einhaltung der DSA (Digital Services Act) und AI-Act Richtlinien konzentrieren, die Anbieter digitaler Dienste zum Monitoring von Text, Bild und Videos und regelmäßigem Reporting verpflichten. Ziel ist unter Anderem die Entwicklung von Methoden der GenKI zum Erkennen, Bewerten und Validieren von Diskriminierung, Bias, illegalen Inhalten, Black Pattern oder zielgerichteter Werbung und die Generierung von Berichten, Zusammenfassungen und Begründungen mit Referenzen zu betroffenen Gesetzen. Die herkömmlichen Methoden können z.B. aus den zahllosen Webinhalten über Drogen nur sehr begrenzt herausfinden, welche 2% der Inhalte wirklich auf illegale Aktivitäten hinweisen. Mit GenKI kann der Assistent feingranularer einordnen, ob Inhalte tatsächlich eine kritische Schwelle überschreiten und ein relevanter illegaler Kontext vorliegt, auch wenn die gesuchten Begriffe oft gar nicht genannt sind. Dazu erhalten Redaktionen Transparenz über Glaubwürdigkeit durch zugrundeliegende Argumentationsketten und Quellen, so dass sie schrittweise kritische Inhalte durchleuchten, analysieren und bewerten können.
Der Assistent zur Generierung von Demonstratoren für den Kreativ-/Kulturbereich erlaubt die Erstellung visueller Demonstratoren basierend auf generierten 3D-Assets und Szenarien sowie abstrakten Datenvisualisierungen oder Skizzen für frühe Konzept-/Pitchphasen für die Kreativwirtschaft und verwandten Branchen wie Architektur, Events und Kultur. Beispiele könnten ein Modell für ein visionäres Bauprojekt oder die schnelle 3D-Visualisierung eines komplexen Sachverhalts zur besseren Vermittlung (z.B. für journalistische Recherchen) sein. Dabei sollen auf Basis von GenKIMethoden sowohl statische 2D-Visualisierungen erzeugt werden wie auch 3D-Assets, die dann in immersiven VR/AR/MR Umgebungen genutzt werden können. Dazu erfolgt eine Generierung von passgenauer visueller oder textueller Ansprache von Nutzenden zur Erhöhung der Vermittlungsqualität und Inhalts-Retention. Hierbei können von der GenKI insbesondere auch kognitive Einschränkungen zur Sicherung der Barrierefreiheit berücksichtigt werden.
LLM-Plug-ins
Es werden Plug-ins zur Wissensorganisation entwickelt, die LLMs durch die Nutzung von symbolischem, regelbasierten Wissen ergänzen. Hierbei sollen sowohl Falschinformationen in den zum Fine Tuning verwendeten Trainingsdokumenten und den Prompts identifiziert werden, um Nutzende darauf hinzuweisen oder Korrekturvorschläge zu unterbreiten. Durch Eingriffe in den Generierungsprozess (Guided LLM) mittels symbolischen Wissens soll die Ableitung strukturierter Informationen mittels Grammatiken verbessert und durch Überprüfung resp. Steuerung der Textgenerierung, Falschinformationen reduziert werden. Durch diese Verfahren soll die inhaltliche Korrektheit von generierten Texten und die Ableitung und Aggregation von Wissen und Informationen für das unternehmensinterne Wissensmanagement gesichert werden. In neuen Anwendungsgebieten profitieren Anwendende von qualitativ hochwertigen Antworten durch ein neuartiges, die Terminologie des Anwendungsgebiets berücksichtigendes Retrieval-AugmentedGeneration (RAG), das auf einem neuartigen “Semantic Information Retrieval” basiert.
Das Plug-in zu Transparenz und Vertrauen adressiert Defizite von KI-Sprachmodellen, wie z.B. die geringe Transparenz über Entscheidungen der KI, nicht-konsistente oder nicht-nachvollziehbare Schlussfolgerungen sowie sprachlich-inhaltliche Modell- und Daten-Bias. In GenKI4Media werden Redaktionen, Gutachtende oder Endnutzende in die Erstellung und Verarbeitungsschleife der KI einbezogen, so dass sie den Domänenkontext feiner konfigurieren können, sichere externe und interne Quellen unterscheiden, sowie Argumentationsketten durch Reasoning im Branchenkontext überprüfbar werden. Dazu werden Methoden erklärbarer KI (XAI) zur multimodalen dialogischen Erklärbarkeit sowie neuro-symbolische Ansätze zur transparenten Quellenattribution und faktischen Validierung generierter Texte entwickelt. Zur Validierung und Prüfung existierender Modelle werden domänenspezifische Contrast bzw. Challenge Sets entwickelt, die kritische Fälle in realen Anwendungsszenarien prüfen.
Synergie von symbolischer KI und LLMs
Die kooperative Kombination der symbolischen KI-Ansätze mit den dialogischen Vertrauens- und Attributionsmechanismen sowie deren Integration mit LLMs stellt einen signifikanten technischen Innovationssprung dar. Im Rahmen des Projektes werden hierfür die in folgender Abbildung gezeigten Verarbeitungsprozesse der KI-Komponenten in Abhängigkeit von den KMU- und Anwendungspartnern realisiert. Durchgezogene Pfeile symbolisieren hierbei obligatorische Prozesse, gestrichelte Pfeile optionale Prozesse, die in Abhängigkeit von den Anforderungen der Projektpartner umgesetzt werden.
Die linke Seite der Abbildung skizziert hierbei drei Prozesse, das einfache Fine Tuning von LLM (in der Mitte), Fine Tuning mit qualitätsgesicherten Input-Daten (oben) und die Qualitätssicherung der angepassten Modelle mittels Test-Suites (unten). Die rechte Seite skizziert vier Prozesse, zwei obligatorische: RAG auf Basis von “Semantic Information Retrieval” (oben), transparente XAI mittels eines dialogischen Assistenten (unten). Zwei weitere optionale Prozesse für Guided LLM werden in der Mitte skizziert: die gesteuerte Generierung strukturierter Informationen mittels Grammatiken (oben) und der gesteuerten Generierung von Texten zur Vermeidung von Falschinformationen (Halluzinationen) in der unteren Mitte.