Die Analyse generativer KI-Modelle im Hinblick auf Responsible AI (RAI) stellt neue methodische und technische Anforderungen. Der Beitrag befasst sich mit einer erweiterten Version des VERIFAI-Frameworks, das über Klassifikationsmodelle hinausgeht und erste Ansätze zur systematischen Analyse generativer Sprachmodelle ermöglicht.
Das Framework unterstützt die softwaregestützte Bewertung verschiedener Aspekte wie Fairness, Erklärbarkeit, Datenschutz und Sicherheit. Anhand eines aktuellen Sprachmodells werden beispielhafte Ergebnisse vorgestellt. Die bisherigen Analysen lassen darauf schließen, dass ein integrierter, reproduzierbarer Ansatz zur verantwortungsvollen Modellbewertung auch für generative KI praktikabel umsetzbar ist.
Anmeldung