ZIB-Logo
KONRAD-ZUSE-ZENTRUM
FÜR INFORMATIONSTECHNIK
BERLIN

Bibliometrie - Klassifikation und Ähnlichkeitsanalyse von mathematischen Publikationen

Projekt in Kooperation mit Institut für Forschungsinformation und Qualitätssicherung, Kompetenzzentrum Bilbiometrie (iFQ) und Universität Bielefeld - Institut für Wissenschafts- und Technikforschung (IWT)

Metadatengraph

Im Gegensatz zu den bisher im Kompetenzzentrum Bibliometrie verfolgten Ansätzen zur Klassifizierung von Artikeln, bei denen jeweils nur mit einem Teil der zur Verfügung stehenden Metadaten gearbeitet wird (Beispiel: Ko-Wort- und Ko-Zitationsanalyse), sollen in diesem Projekt alle zur Verfügung stehenden Metadaten (wie Titel, Autor, Zeitschrift mit bibliographischen Angaben, Abstract, Referenzen, Autorenschlagworte, Klassifizierung der Zeitschrift etc.)  zusätzlich zu den Volltexten berücksichtigt und darauf basierend unterschiedliche Ansätze zur Analyse von Dokumentähnlichkeiten getestet und kombiniert werden. Erfahrungen des ZIB haben gezeigt, dass die Konzentration auf nur einen Teil der verfügbaren Informationen zu wenig aussagekräftigen Ergebnissen führt. Die Ergebnisse der unterschiedlichen Ansätze sowie ihre Kombination sollen sowohl untereinander als auch mit bereits vorhandenen Fachklassifikationen oder Thesauri verglichen und durch Experten validiert werden.

Das Ziel ist es, eine Anwendung für die Mathematik als proof-of-concept zu entwickeln, der basierend auf einem umfassenden Metadatengraphen mathematische Dokumente klassifizieren, sie bibliometrisch analysieren und Ähnlichkeiten der Dokumente untereinander bestimmen kann.

Die Grundlage für das weitere Vorgehen bildet der Metadatengraph, der aus den iFQ-Daten gebildet werden muss. Es werden Algorithmen entwickelt, die aus den gegebenen Daten und anhand von existierenden Klassifizierungen (für die Mathematik z.B. Mathematical Subject Classification MSC) die mögliche Zuordnung zu einer oder mehreren Klassen dieser Klassifikation berechnen. Darüber hinaus werden mit den Algorithmen bibliometrische Analysen ermöglicht. Als mögliche Analysen seien hier das Ermitteln von Zeitreihen, Zitationen und Ko-Autorenschaft genannt. Weitere Algorithmen können anhand der Graphstruktur zusätzlich zur Klassifikation der Publikationen und einem definierten Ähnlichkeitsmaß die Ähnlichkeit der Dokumente untereinander berechnen.