News

KI Wissen

Zwei neue Publikationen zur Wissensextraktion

Die Wissensextraktion ist eines der Kernthemen von KI Wissen. Dazu werden im Projekt verschiedene Methoden zur Extraktion von Wissen untersucht und entwickelt. Dies soll u.a. zur Erklärbarkeit und Analysierbarkeit von KI-Systemen beitragen. Neue Veröffentlichungen beleuchten nun zwei dieser Methoden.

 

Zunächst wird in dem in der IEEE MLSP 2022 veröffentlichten Beitrag "SViT: Hybrid Vision Transformer Models with Scattering Transform" untersucht, wie eine grafische Entität (Token) mit eindeutigen semantischen Darstellungen in Bildern spezifiziert werden kann. Als zunehmend populäre Netzwerkarchitektur ermöglicht Transformer nicht nur eine beachtliche Leistung bei der Verarbeitung natürlicher Sprache, sondern zeigt auch eine vergleichbare Fähigkeit zur Merkmalsextraktion wie Faltungsneuronale Netze bei Computer Vision Aufgaben.  Durch die Kombination von Scattering Transform mit Vision Transformer (ViT) demonstriert diese Arbeit die Wirkung verschiedener Tokenisierungsansätze.

Im Gegensatz zu SViT, das sich mit lokaler semantischer Repräsentation befasst, gibt die zweite Veröffentlichung "Concept Embedding Analysis: A Review" einen Überblick über Methoden, die darauf abzielen, globale, auswertbare Assoziationen von menschlich interpretierbaren semantischen Konzepten mit internen Repräsentationen eines tiefen neuronalen Netzes zu finden.

Das neue Papier stellt daher eine allgemeine Definition der Konzept(einbettungs)analyse (CA) und eine Taxonomie für CA-Methoden auf, die verschiedene Ideen aus der Literatur vereint. Dies ermöglicht eine einfache Positionierung und einen Vergleich von CA-Ansätzen. Ausgehend von den definierten Begriffen wird der aktuelle Stand der Forschung zu CA-Methoden und interessanten Anwendungen aufgezeigt und mehr als dreißig relevante Methoden werden diskutiert, verglichen und kategorisiert. Für Praktiker wird schließlich ein Überblick über fünfzehn Datensätze gegeben, die für die überwachte Konzeptanalyse verwendet wurden, und es werden zukünftige Herausforderungen und Forschungsrichtungen aufgezeigt. Langfristig kann die Möglichkeit, gespeichertes Wissen aus DNNs auszulesen, für die Fehlersuche, die Überprüfung oder den Wissensgewinn nützlich sein. Dementsprechend hat CA mehrere wichtige Anwendungen, wie z.B. bei der Verifizierung von symbolischen Anforderungen an DNNs für Sicherheitsnachweise.

Bild: Oleg Klementiev  © CC BY 2.0; Nick Webb © CC BY 2.0; Yandle  © CC BY 2.0