Projektziele
“Wer die Relevanz von KI weiterhin nicht erkennt, könnte bald von der Konkurrenz abgehängt werden.” Deshalb benötigt die deutsche Wirtschaft Unterstützung bei der Einführung von generativer KI – oder kurz GenKI – , die durch Nutzung standardisierter Schnittstellen und Open Source flexibel in bestehende IT-Umgebungen integrierbar ist.
Angesichts dieser Herausforderung plant das Projekt die Entwicklung von innovativen KI-Assistenten und Plug-ins für den Medien-, Kultur- und Kreativbereich, die das innovative Potential generativer KI ELSI-konform erschließen und für das Wissensmanagement in andere Branchen übertragbar sind.
Mit der entstehenden GenKI-Lösung, die gezielt konkrete Branchen und Aufgabenbereiche adressiert, wird insbesondere der Mittelstand gefördert, der sich oft keins der kostenintensiven, umfangreichen Angebote der Marktführer leisten kann. In dem die neuen generativen KI Assistenten zu folgenden förderpolitische Zielen beitragen unterstützt das Projekt die Standortsicherung, Beschäftigung und Wettbewerbsfähigkeit:
- die weitere Automatisierung von Prozessen und Routinetätigkeiten: da die Assistenten auf konkrete Aufgabenfelder einer Domäne fokussieren und in vielen Fällen sogar für einzelne Arbeitsplätze oder Tätigkeiten eingerichtet werden, wird es möglich, spezielle Workflows mit ihren vielfältigen Verzweigungen effektiv zu unterstützen. Dabei erfolgt das LLM-Training zunächst mit den multimedialen Materialien für die Domäne und anschließend mit den konkreten Dokumenten, die für eine bestimmte Aufgabe benötigt werden. Damit können mehr Routine-Tätigkeiten in Redaktionen, Agenturen oder Behörden zur Generierung von Inhalten oder zur Prüfung und zum Monitoring effizienter als bisher automatisiert werden.
- Generative KI als wichtiges Instrument zur Bewältigung des Fachkräftemangels: Durch die im letzten Punkt genannte Eigenschaft der flexiblen Konfiguration der Assistenten kann dem Fachkräftemangel entgegengewirkt werden. Dabei wird es voraussichtlich so sein, dass viele einfache Routine-Tätigkeiten von Fachkräften vollständig vom Assistenten geleistet werden können, aber bei anspruchsvolleren Aufgaben wird die Fachkraft lediglich unterstützt. Damit werden voraussichtlich einige Arbeitsplätze wegfallen, aber die verbliebenen werden effektiver, interessanter und sicherer als vorher.
- eine Steigerung der Innovationskraft wird durch die Assistenten erreicht, indem sie ein adhoc Brainstorming durch die Generierung von Entwürfen und Visualisierungen unterstützen. Dabei können Architekten, Designer oder Drehbuchautoren die Assistenten nutzen, um dynamisch verschiedene Entwürfe für vielfältige Kombinationen ihrer Ideen zu generieren.
- die Steigerung der Resilienz: da die Assistenten keine feste Programmierung erfordern, sondern neue Regelungen, Prozesse oder Vorgaben durch Training flexibel übernommen werden können, wird eine Anpassung an fortlaufend veränderte Produktionsbedingungen möglich. Dabei ist ein Input aus verschiedenen Quellen mit multimedialen Dokumenten in variablen Formaten möglich. Dies verbessert auch die Nachhaltigkeit von Wertschöpfungsketten, indem eine Ressourcen-schonende Anpassung an veränderte Prozesse einschließlich der Einbindung von neuen 3rd Party Services möglich wird.
- die Verbesserung und Schaffung neuer Geschäftsmodelle: mit der innovativen GenKI4Media Lösung können neue Geschäftsmodelle entstehen, da die verschiedenen Schritte der Wertschöpfungsketten zur Inhaltserstellung und Verwaltung effizienter ausgeführt werden können. Dies eröffnet das Potential für neue Geschäftsmodelle, da dazu neue Prozessanalysen benötigt werden, die Assistenten mit Konfiguration und Training einzurichten sind, sowie Schulung und Betrieb erforderlich werden.
Wirtschaftspolitische und gesellschaftspolitische Ziele
Durch die Bereitstellung einer flexiblen, offenen Plattform soll ein niedrigschwelliger Einstieg in die GenKI für KMU ermöglicht werden. Dabei wird die Plattform so ausgelegt, dass sie auch künftige Modelle nutzen kann und mit zusätzlichen Plug-ins und Assistenten erweiterbar ist. 2024 wurde der EU AI Act verabschiedet, der Anbieter zu mehr Transparenz bei ihren KI-Angeboten verpflichtet. Die innovativen KI-Funktionen der Partner sollen diese Transparenz durch Vermeidung von Falschinformationen und bessere Erklärbarkeit leisten. Durch die gute Vernetzung aller Partner können in Events und Publikationen die entstehenden KI-Assistenten breitenwirksame Impulse und Transferleistungen in Deutschland und der EU bewirken. Durch die Fokussierung der neuen Anwendungen auf die Bereiche Medien, Kultur und Kreativwirtschaft sowie Validierung und Transparenz erhält das Projekt eine hohe gesellschaftspolitische Relevanz.
Offenheit des Vorhabens
Das Konsortium beabsichtigt, LLMs europäischer und nationaler Provenienz, wie Mistral, Teuken-7B, Luminous oder Occiglot einzusetzen, mit dem Schwerpunkt auf Open-Source (OS) Lösungen. Darüber hinaus sollen die entwickelten Lösungen durchgängig auf offene Standards für Schnittstellen und Formate aufsetzen und kompatibel zu anderen OS Modellen wie LLaMA 2, Code LLaMA oder MPT sein. Der Fokus auf OS-Modelle ermöglicht Anpassungen am Code, um in den Generierungsprozess steuernd einzugreifen, so dass die Qualität des Outputs erhöht werden kann. Anpassungen der Modelle an die Domänen und Inhalte der Anwendungspartner werden durch die Entwicklung neuer Fine-Tuning Methoden vorgenommen. Die Partner planen, ein Freemium Modell zu nutzen, um eine initiale Basis von Trainingsdaten und Modellen als OS zur Verfügung zu stellen, während die leistungsfähigeren entstandenen Modelle zusammen mit der Nutzung der Assistenten von den KMUs kommerziell vermarktet werden. Die entstehende Lösung wird über eine verteilte, skalierbare Cloud-Architektur betrieben, die kein zentrales Hosting erfordert. Jeder KMU-Partner stellt Cloud-Ressourcen und Betreuung für seine Assistenten bereit, die mit wachsender Anzahl von Kunden einfach erweitert und finanziert werden können. Um eine möglichst hohe Sicherheit zu gewährleisten, wird die entstehende Lösung die gesetzlichen Vorgaben (z.B. EU AI Act, DSA) berücksichtigen und existierende BSI-kompatible Frameworks, Standards und Protokolle nutzen, die Gefährdungen weitgehend ausschließen.
Innovation
Die GenKI-Technologie hat in den letzten Jahren große Fortschritte gemacht und beeindruckende Ergebnisse erzielt. Allerdings ist GenKI bisher nur begrenzt von KMUs nutzbar, da sie nicht ausreichend auf die Domänen der Unternehmen spezialisiert sind, fehlerhafte Aussagen beinhalten und viele Schlüsse und Empfehlungen der KI kaum nachvollziehbar sind. Vor diesem Hintergrund sind die wissenschaftlichen und technischen Arbeitsziele des Gesamtprojektes die Erforschung und Entwicklung von:
- innovativen Assistenten auf Basis von GenKI Technologie, die automatisch intelligente Prozesse für ihre Zielgruppen ausführen
- Plug-ins zur Wissensorganisation und Transparenz, mit denen der aktuelle Stand der Technologie zu LLMs und symbolischer KI weiterentwickelt wird
- einer GenKI4Media Plattform, die alle neuen Komponenten des Projektes miteinander verbindet; dazu werden
- während der Projektlaufzeit möglichst leistungsfähige deutsche und europäische LLMs ausgewählt und
- ein effizientes Fine Tuning mit Domänen-spezifischen Materialien für die drei neuen Assistenten bereitgestellt sowie
- Anwendungsszenarien, mit denen die entstehende GenKI Lösung einschließlich eines ELSI-Monitorings von DSA und AI-Act validiert werden kann.
Aufgabenstellung
Die zentrale Innovation des Gesamtprojektes ist die Etablierung einer Plattform, mit der KI-Assistenten für konkrete, spezifische Bedarfe unterschiedlicher Zielgruppen auf den Markt gebracht werden können. Die Plattform-Architektur erlaubt es dabei, einfach und mit geringem Aufwand, eigene Lösungen einem größeren Markt zur Verfügung zu stellen und zu monetarisieren: damit können sowohl etablierte wie auch innovative KMUs, die eigene Verarbeitungsprozesse für domänenspezifische Probleme entwickelt haben, diese mit den neuen Assistenten ausweiten und verbessern. Der Markt aus KI-basierten Lösungen ist groß und unübersichtlich. Es existieren eine große Anzahl von Modellen und Tools, die in diversen Geschäfts- und Wertschöpfungsprozessen signifikante Mehrwerte bringen können, Unternehmen jedoch vor drei zentrale Probleme stellen:
- Unternehmen haben kein Personal mit geeigneten Qualifikationen, um den Markt für KI-Lösungen konstant zu evaluieren und auf Eignung für die Integration in ihre Geschäftsprozesse zu testen.
- Die Bewertung der Qualität der Lösungen ist zeitlich aufwändig und setzt oft große Hardware-Ressourcen voraus und
- Die Integration dieser Lösungen in bestehende Verarbeitungsprozesse ist schwierig, da die meisten Modelle nicht mit Blick auf eine solche Integration hin entwickelt wurden.
Genau diese Herausforderungen adressiert das GenKI4Media-Projekt: Die Plattformstrategie zielt darauf ab, ein Ökosystem aus fertigen, in Domänen-spezifische Verarbeitungsprozesse integrierbare KI-Assistenten zu etablieren. Das Projekt stellt dazu sowohl einige initiale qualitativ hochwertige Lösungen für konkrete Domänen bereit, als auch die Ressourcen und Materialien, um diese direkt zu testen und einzusetzen. GenKI4Media bietet auf diesem Weg nicht nur den Anbietern von KI-Assistenten einen einfacheren Marktzugang, sondern ermöglicht auch der Abnehmerseite eine Beschleunigung des Entwicklungsprozesses bis hin zum Produktiveinsatz.
Das Potential der Innovationen durch GenKI-Methoden
Generative KI-Methoden haben immer noch mit diversen Herausforderungen bzgl. der Qualität und der Vertrauenswürdigkeit zu kämpfen: Falschinformationen (so genannte “Halluzinationen”) schrecken immer wieder Unternehmen davon ab, KI-Systeme in ihre Prozesse zu integrieren. Die GenKI4Media-Plattform stellt hier Tools bereit, die
- Ausgaben der KI-Verfahren der Plug-ins und der KI-Assistenten prüfen bzw. interaktiv weiterverarbeiten und
- durch die auf der Plattform komplexere Workflows aus mehreren Assistenten zusammengestellt werden können, die genau diese Vertrauenslücken schließen können.
Die Kerninnovation des Projektes liegt am Ende darin, aktuelle Forschung im Bereich der KI durch einfach nutzbare und idealerweise in bestehende Tools integrierbare Assistenten für die wertschöpfende Nutzung zugänglich zu machen. Hierbei werden insbesondere folgende innovative Mechanismen der GenKI aufgegriffen und weiterentwickelt:
- durch Reflexion wird es möglich, dass eine LLM zurückliefern kann
- wie vertrauenswürdig 1) die von ihr generierten Ergebnisse und 2) die zur Analyse und Generierung genutzten Quellen sind und
- wie ihre Argumentationsketten sind, und aufzählen in welchen Schritten die KI zu ihrem Ergebnis gekommen ist; dies ermöglicht eine manuelle Korrektur der Schritte durch die Nutzenden
- es werden Verfahren eingesetzt, bei denen mehrere LLM nacheinander genutzt werden, die sich gegenseitig prüfen
- eine Verfeinerung kann durch iterative Nutzung und wiederholtes Fine-Tuning des LLM mit speziellen Materialien und Prompts erreicht werden und
- durch eine kaskadierende Nutzung von GenKI-Methoden wird es einfach möglich, z.B. Ergebnisse oder Argumentationen durch Bilder, Tabellen oder Videos zu visualisieren.
Die im Projekt zu entwickelnden Assistenten bilden dabei eine große Spannbreite von möglichen Einsatzszenarien ab: Von der Generierung multimodaler Inhalte von Texten, Bildern und 3D Assets bis hin zur Qualitätssicherung illustrieren die Assistenten die Leistungsfähigkeit und Flexibilität der Plattform. Dabei kann OpenSource genutzt werden, wie z.B. Stable Diffusion, BentoML oder ComfyUI.