B. KI-gestützte
Erschließung
Medienerschließung
im aktuellen
Bestand
- Automatisches
Erschließungssystem: Projekt der Deutschen Nationalbibliothek
(DNB) im Rahmen des Netzwerk maschinelle Verfahren in der Erschliessung.
Ziel ist es, durch die Anwendung innovativer Methoden der Künstlichen
Intelligenz für die Aufbereitung und Analyse von Texten und Metadaten,
die Qualität maschineller inhaltlicher Erschließung weiter
zu verbessern
- Texte
erschließen mit KI (DNB): "In der Deutschen Nationalbibliothek
arbeiten wir verstärkt an Automatisierung und setzen KI für
die automatische Erschließung ein. Bei täglich mehr als
6.500 eingehenden digitalen Medienwerken erhalten Nutzer*innen dadurch
schnell und effektiv Zugang zu den neuesten Veröffentlichungen.
Wie funktioniert das? Die Kolleg*innen unseres Referats Automatische
Erschließungsverfahren, Netzpublikationen erklären in
dieser Serie den Weg von digitalen Medienwerken mit ihren Metadaten
in und durch die DNB bis hin zur Erschließung mit Hilfe von
Verfahren der KI."
- Netzwerk
maschinelle Verfahren in der Erschließung (DNB): "Die
Deutsche Nationalbibliothek (DNB) nutzt seit mehr als zehn Jahren
Technologien des Maschinellen Lernens und Natural Language Processing
für die inhaltliche Erschließung von Medienwerken. Erschließung
bedeutet in diesem Zusammenhang, den Inhalt der Medienwerke in den
bibliografischen Metadaten präzise zusammenzufassen, damit
Literaturrecherchen zu guten Ergebnissen führen. Die
Grundlage unserer maschinellen Analyseprozesse sind unstrukturierte
Texte, beispielsweise die Volltexte oder Inhaltsverzeichnisse gesammelter
Publikationen. Soweit vorhanden fließen auch Metadaten in
die Analysen mit ein. Für die thematische Einordnung der Medienwerke
verwenden wir Sachgruppen und Kurznotationen der Dewey-Dezimalklassifikation
(DDC). Die verbale Erschließung führen wir mit dem Vokabular
der Gemeinsamen Normdatei (GND) durch. Das heißt: Es entstehen
semantische Verknüpfungen der Medienwerke mit den Entitäten
dieser Normdatei. Vor
diesem Hintergrund arbeiten wir fortlaufend daran, die Analyseprozesse
weiterzuentwickeln, zu optimieren oder zu erneuern, um die Qualität
der Erschließungsresultate zu verbessern und die Anwendungsbereiche
der maschinellen Analysen auszuweiten."
- Beispiele:
maschinell indexierte Schlagwörter von e-books
- Automatisierung
der Sacherschließung (AutoSE): Die ZBW – Leibniz-Informationszentrum
Wirtschaft nutzt für ihren produktiven AutoSE-Dienst das Toolkit
Annif (Finnische Nationalbibliothek), entwickelt eigene Machine-Learning-Modelle
und flankierende Mechanismen für Parameteroptimierung, Qualitätskontrolle
und den Anschluss an die Metadatenworkflows der ZBW
Integration
von KI-Tools in den eigenen Bibliothekskatalog
- Beispiel: Katalog
der ETH-Bibliothek Zürich:
dort auch Weiterleitung und Extraktion der Trefferliste an openknowledgemaps.
(siehe oben)
KI-Empfehlungssysteme
(Recommender / Chatbots) in Bibliothekskatalogen
- Katalog
der Stadtbibliothek München
- Neues KI-Tool gibt Lektüretipps: "Seit Anfang Februar bietet
der Online-Katalog der @muenchner_stadtbibliothek das Feature „Ähnliche
Medien“. Mit der Funktion erhalten Kundinnen und Kunden bei Eingabe
eines Titels bis zu 50 weitere Vorschläge, die thematisch passen
und Inspiration für weiteren Lesestoff liefern. Eine KI analysiert
dazu den Klappentext und setzt andere Publikationen aus dem Gesamt-Bestand
in Bezug. Die Nutzenden bekommen dann Medien angezeigt, die in einem
gemeinsamen Kontext mit dem gesuchten Titel stehen. So wird die Suche
nach dem nächsten Lieblingsbuch noch einfacher!"
- Hinweise
zur Funktion: "Für die Berechnung der Empfehlungen
wird ein Embedding-Modell und eine Open-Source-Vektordatenbank
genutzt, die über eine OAI-Schnittstelle mit dem Bibliothekssystem
verbunden sind. Die Datenbasis sind frei zugängliche Inhaltstexte
aus unserem Online-Katalog. Diese werden in Datenpunkte umgewandelt
und in einem Vektorraum angeordnet. Je näher die Medienbeschreibungen
in diesem Raum beieinander liegen, desto ähnlicher sind die
Inhalte."
- KI-Empfehlungs-Chatbot
(Verbund der
Öffentlichen Bibliotheken Berlins) mit Medienempfehlungen:
"Der Chatbot weiß nicht auf alles eine Antwort, aber bei
vielen Fragen kann er helfen, gerade wenn es um Empfehlungen geht. Das
können Medien wie Bücher oder Filme, Gegenstände aus
der Bibliothek der Dinge oder z.B. Spiele sein. Auch digitale Medien
sind enthalten. Er kann immer dann am besten helfen, wenn Sie einfach
auf der Suche nach Empfehlungen sind, wie einem „Roman für
den Urlaub, der am Meer spielt“.
Welche Fragen kann ich dem Chatbot stellen?
Mögliche Fragen sind zum Beispiel: Ich suche
einen Krimi, der in Berlin in der ersten Hälfte des 20. Jahrhunderts
spielt.
Mir gefiel „Die drei Sonnen“ sehr gut, gibt es etwas Ähnliches?
Ich möchte gerne Die ZEIT lesen. Wie ist das möglich?"
Erschließung
ausgewählter Kulturgüter (kulturelles Erbe) - Datenanalyse digitaler
Bestände
- Altbestandserschließung
mit KI-Anwendungen: Ziel des Projekts der Universitätsbibliothek
Tübingen ist es, historische Bestände aus der Universitätsbibliothek
und dem Universitätsarchiv mithilfe von Volltexten zusätzlich
zur digitalen Präsentation für die Nutzer*innen leichter zugänglich
zu machen und neue Forschungsfragen sowie die Bearbeitung von großen
Textmengen zu ermöglichen
- Beispiel: handschriftlicher
Afrika-Expeditionsbericht
von 1910 --> Handschriftliche Reisetagebücher werden mit
OCR-Software digitalisiert; ChatGPT optimiert OCR-Digitalisierung,
hilft Schlüsselbegriffe zu ermitteln und erstellt Kurzinhaltsangaben
- KI
und Digital Humanities in Bibliotheken (DNB als Workshopveranstalterin):
"Die dynamische Entwicklung digitaler Technologien eröffnet
neue Möglichkeiten, Sammlungen auf- und auszubauen, sie zu erschließen
und sie für Forschungsaufgaben zu nutzen. Anwendungen computergestützter
Verfahren und digitaler Ressourcen in den Geistes- und Kulturwissenschaften
werden als Digital Humanities (DH) bezeichnet. Der Begriff Künstliche
Intelligenz (KI) bringt zum Ausdruck, dass Algorithmen zum Einsatz kommen,
die bestimmte Aufgaben unterstützen. In Bibliotheken wird KI beispielsweise
dafür verwendet, Texte oder Bilder inhaltlich zu klassifizieren,
ähnliche Objekte in den oftmals sehr großen Sammlungen zu
finden oder Funktionen der semantischen Suche anzubieten."
- Mensch.
Maschine. Kultur – Künstliche Intelligenz für das digitale
Kulturelle Erbe: Umfangreiches Projekt der Staatsbibliothek zu Berlin,
das KI-Verfahren u.a. in den Bereichen Dokumentenanalyse, Extraktion
und Klassifizierung von digitalen Bildinhalten, Inhalts- und Sacherschließung
nutzt
- Grand
Tour digital:
Digitalisierung, Erschließung und Visualisierung frühneuzeitlicher
Selbstzeugnisse von Bildungsreisen unter Anwendung teilautomatisierter
Editionsverfahren (HAB Wolfenbüttel)
Bild- / Foto-
/ Videoauswertung
- bavarikon:
Internetportal des Freistaats Bayern zur Präsentation digitalisierter
Kunst-, Kultur- und Wissensschätzen aus Einrichtungen in Bayern
- TIB
AV Portal: verzeichnet ca. 50.000 "...qualitätsgeprüfte
wissenschaftliche Videos. ... darunter Konferenzaufzeichnungen, Lehrvideos,
Experimente, Interviews und Animationen. Diese Videos werden langzeitarchiviert,
erhalten einen Digital Object Identifier (DOI) und werden mittels automatischer
Analyseverfahren wie Shoterkennung, Video-OCR, visueller Konzeptklassifikation
und Named-Entity Linking erschlossen. Seit Juli 2023 werden neu hochgeladene
Videos mithilfe der von OpenAI als Open-Source bereitgestellten Software
Whisper transkribiert und ins Englische übersetzt. Diese Verfahren
ermöglichen eine präzise Durchsuchbarkeit der Videoinhalte
sowie die gezielte Abrufbarkeit relevanter Abschnitte."
Medienerschließung bei der Lektorierung (Öffentliche
Bibliotheken)
- die ekz
Reutlingen entwickelt derzeit KI-gestützte Werkzeuge, die Bibliothekarinnen
und Bibliothekare bei der Marktsichtung und inhaltlichen Erschließung
unterstützen und den Erwerbungsprozess beschleunigen.
|