BA-Projekt
"Wissenschaftliche Suchdienste im Web"
Projekthintergrund
In den letzten Jahren haben
sich - ergänzend zu den allgemeinen Suchdiensten (und inbesondere google)
eine Reihe von wissenschaftlichen Suchdiensten etabliert, die teilweise von
kommerziellen Suchmaschinenbetreibern (Google Scholar) aber auch von bibliotheks-
bzw. fachwissenschaftlichen Initiativen (z.B. BASE, bibliothekarische Fachinformationsdienste
etc.) entwickelt wurden.
Doch wie nutzerorientiert
sind diese Dienste und wie gut kommen Nutzer mit diesen Dienstleistungen überhaupt
zurecht? Im Projekt werden wir ausgewählte wissenschaftliche Suchdienste,
insbesondere wissenschaftliche Suchmaschinen näher kennenlernen
und anhand verschiedener Testszenarios einmal kritisch "auf den
Prüfstand" stellen und gegebenenfalls auch explorative
Nutzerbefragungen durchführen.
Mögliche Aufgabenbereiche
für die Projektteams
Alle Teams
- Einarbeitung in die Gesamtmaterie
"Wissenschaftliche Suchdienste", inbesondere wissenschaftliche Suchmaschinen
Aufgaben für einzelne
Projektteams (erste
Vorschläge, Gruppen werden noch festgelegt; ideal: 2-4 Personen pro Gruppe;
es müssen nicht alle Themen bearbeitet werden)
- Team 1: Wissenschaftliche
Suchdienste im Überblick
- 1a: Ausführlicher
Vergleich einzelner wiss. Suchmaschinen miteinander, z.B. google scholar
versus BASE versus Semantic Scholar (Funktionalitäten, Bedienung,
persönliche Eindrücke, kurze Testanfrage)
- 1b: Erarbeitung einer
möglichst kurzen Orientierung / eines Leitfadens
für Studienanfänger mit Fokus auf die Anwendung ausgewählter
wiss. Suchdienste (welche wiss. Suchdienste sollten Erstsemester unbedingt
kennen - und wie erklärt man die Bedienung bzw. die jeweilige Charakteristik
möglichst kurz und verständlich)
- Team 2:
Möglichkeiten der Usability Evaluation (Informationsdesign)
bezogen auf Suchmaschinen u. weitere Suchdienste. Entwicklung konkreter Beurteilungskriterien
und eines Test-Szenarios: Anwendung von Beurteilungskriterien und evtl. Befragung/Beobachtung/Interviews
von Probanden
- 2a: Fokus auf wiss.
Suchmaschinen unter a) bzw. unter c) (siehe unten!)
- 2b: Fokus auf wiss.
Suchmaschinen unter b) im Hinblick auf Open Access (siehe unten!)
- Team 3: Relevanz-
und Retrievaltests: Vergleich einzelner Suchdienste mit konkreten
Suchanfragen
- 3a: Fokus auf wiss.
Suchmaschinen (eher kurze Suchanfragen) im Hinblick auf Recall und Precision
- 3b: Durchführung
einer thematischen Recherche mit verschiedenen Suchdiensten (Suchmaschinen,
Discovery Systeme/Bibliothekskataloge, Fachportale/Fachinformationsdienste,
ResearchGate etc.) - Vergleich des Recalls und der Precision
- Einer der folgenden
Aufgabenkomplexe könnte bearbeitet werden
- Raucherentwöhnung
mittels Hypnose. Evaluierung dieser Methode. Möglichst deutschsprachige
Zeitschriftenartikel
- Gesundheitsgefährdung
durch Handys. Möglichst zusammenfassende deutschsprachige
Arbeiten
- Risiko von
Zahnfüllungen mit Amalgam. Möglichst zusammenfassende
deutschsprachige Arbeiten
- optional:
selbst gewähltes Thema
- Team 4: Nutzerbefragungen
/ Nutzungsverhalten zu ausgewählten wiss. Suchmaschinen: Erarbeitung
entsprechender Erhebungsinstrumente (Beobachtungen/Thinking aloud, Interviews,
Bildschirm-Mitschnitte) und Durchführung mit einer ausgewählten
Kleingruppe (im Sinne einer Laborsituation)
- (optional:) Team 5: Vergleich
der Zitationsfunktion von Google Scholar mit den klassischen Zitations-Datenbanken
WoS und/oder Scopus (s. bei Punkt D)
Konkrete Organisation
- Einrichtung von Diskussions-/Gruppenforen
(via moodle)
- Einrichtung eines media-Wikis
für den fortlaufenden Projekt-Content
- ständiger E-mail-Kontakt
/ Video-Konferenz-Kontakt
- Sitzungen für Start-,
Zwischen- sowie Endergebnisse
Leistungsnachweis
- permanente und eigenständig-kreative
Mitarbeit (!!)
- qualifizierter Projekt(teil)-Bericht
bzw. gemeinsamer Endbericht pro Projektgruppe bis zum Ende des Sommer-Semesters
via e-mail
Das Themengebiet
der Wissenschaftlichen Suchdienste
A. Wissenschaftliche
Suchdienste / Wissenschaftliche Suchmaschinen
Kurzcharakteristik
...
- durchsuchen nach festgelegten
Auflistungen (sog. "white lists") Webseiten mit akademischen Inhalten
von wiss. Einrichtungen (Hochschulen, Instituten), wiss. Dokumentenservern
(überwiegend Open
Access (OA), auch sog. Preprint-Server --> Bsp. arxiv.org),
Wissenschaftsverlagen (insbesondere deren E-Journals, soweit verfügbar
u. eine Zusammenarbeit mit wiss. Suchmaschinen getroffen) und die DOI-Datenbanken
crossref.org (DOI = Digital Object
Identifier, eindeutige Identifizierung von wiss. Quellen/Papers im Netz!)
- erstellen einen eigenen
durchsuchbaren Index aller besuchten Webseiten
- teilweise werden
im Index auch Zitationsverbindungen / -häufigkeiten von Dokumenten
abgebildet (vergleichbar mit einer klassischen Zitationsdatenbank!); d.h.
die von einzelnen Dokumenten zitierten Autoren werden zusätzlich
ausgewertet
- durch Zusammenarbeit
mit Bibliotheken (u. bei entsprechender Lizenzierung) direkter Übergang
auf kostenpflichtige Fachdatenbanken bzw. Fachportale möglich
- bieten die von "normalen"
Suchmaschinen gewohnte Auflistung der Treffer nach Relevanz u. damit eine
einfache Bedienung
- sind in der Regel sehr
aktuell
- stammen entweder von
kommerziellen Anbietern wie google (etablierte Suchmaschinen), von bibliotheks-/fachwissenschaftlichen
Initiativen (BASE, Uni Bielefeld) oder existieren mit engem Focus auf eine
Fachdisziplin (CiteSeerX)
a) etablierte und
relativ bekannte wiss. Suchmaschinen
- Google
scholar: "Mit Google Scholar können Sie mühelos
eine allgemeine Suche nach wissenschaftlicher Literatur durchführen.
Sie können von einer Stelle aus viele verschiedene Bereiche und Quellen
finden: Dazu gehören von Kommilitonen bewertete Seminararbeiten, Magister-,
Diplom- sowie Doktorarbeiten, Bücher, Zusammenfassungen und Artikel,
die aus Quellen wie akademischen Verlagen, Berufsverbänden, Magazinen
für Vorabdrucke, Universitäten und andere."; geschätzte
Größe: ca. 500 Mio Dokumente; mit Zitationsdatenbanken-Funktion;
die neuesten Entwicklungen auch im Blog
zu Google Scholar.
b) wiss. Suchmaschinen,
die sich in erster Linie auf Open Access-Inhalte (insbesondere frei verfügbare
Journal-Artikel) konzentrieren
- BASE
- Bielefeld Academic Search Engine: multidisziplinäre Suchmaschine
der Universität Bielefeld für wissenschaftliche Internet-Quellen;
greift auf die deutschsprachigen wiss. Open Access-Server zu; Datenaustausch
über OAI-Protocol for Metadata Harvesting (OAI-PMH); über
"340 Millionen Dokumente aus über 11.000 Quellen. Bei etwa
60% der in BASE indexierten Dokumente sind die Volltexte frei zugänglich
(Open Access)"; berücksichtigt auch Dokumente aus Google Scholar
in den Suchergebnissen.
- CORE:
ermöglicht Zugang zu "Open-Access-Publikationen von verschiedenen
Datenprovidern ... .Dabei handelt es sich um die Daten von mehr als 10.000
institutionellen und fachlichen Repositorien und Verlagen. ... Volltextsuche
in mehr als 300 Millionen wissenschaftlichen Publikationen".
- Semantic
Scholar.org: Akademische Suchmaschine mit KI-Technik - "Find
peer-reviewed research from the world's most trusted sources - We've pulled
over 216 million scientific papers from sources like PubMed,
Nature, and ArXiv. Our AI analyzes research papers and pulls out authors,
references, figures, and topics. We link all of this information together
into a comprehensive picture of cutting-edge research."
- ScienceOpen
- research and publishing network: "Search and discover relevant research
in over 91 million Open Access articles and article records"
- OAIster:
Suchmaschine der Univ. of Michigan für OA-Server, Zusammenarbeit
mit OCLC; Datenaustausch über OAI-Protocol for Metadata Harvesting (OAI-PMH);
über 50 Mio Dokumente aus über 1100 Bibliotheken:
"Union catalog of digital resources"
- paperity
- open science aggregated: "The first multidisciplinary aggregator of
Open Access journals and papers. Keep on top of recent discoveries and never
hit a paywall"; über 10 Mio Aufsätze aus über
17.000 Zeitschriften
- DOAJ
- Directory of Open Access Journals (auch Zugang zu Artikeln aus den Zeitschriften!):
über 10 Mio Zeitschriftenartikel aus über 20 000
Journals aus 135 Ländern in 80 Sprachen
c) weitere große
wiss. Suchmaschinen (die auch im Projekt betrachtet/untersucht werden können)
- WordWideScienceOrg:
"is a global science gateway comprised of national and international
scientific databases and portals. WorldWideScience.org accelerates scientific
discovery and progress by providing one-stop searching of databases from around
the world"; Suchmaschine in Kooperation mit dem US-Energieministerium
und der British Library, umfasst mehr als 200 Millionen Dokumente
aus über 70 Ländern (auch Deutschland)
- ScienceReserach.com:
"is a free, publicly available deep web search engine that uses advanced
"federated search technology" to return high quality results by
submitting your search query - in real-time - to other well respected search
engines then collating, ranking and dropping duplicates of the results. ....
accelerates your research by returning the most relevant results from over
300 authoritative science and technology collections to one, easily navigable
page. Each search is done in real-time, searching the collections you select
as if you were entering the search term on each separate website yourself"
- JURN:
"Search millions of free academic articles, chapters and theses; JURN
is a unique search tool, helping you to find free academic articles and books.
JURN harnesses all the power of Google, but focusses your search through a
hand-crafted and curated index. Established in 2009 to comprehensively cover
the arts and humanities, in 2014 JURN expanded in scope. JURN now also covers
selected university full-text repositories and many additional ejournals in
science, biomedical, business and law. In 2015/6 JURN expanded again, adding
over 600 ejournals on aspects of the natural world."
Ergänzend für
digitalisierte Buchinhalte ...
- Google
Buchsuche: Volltextsuche in Büchern (Buchinhalte!!) ausgewählter
Verlage und Bibliotheken (international, unter weitgehender Wahrung des Urheberrechts;
kostenlose Registrierung erforderlich). Auch für eine Suche nach wiss.
Quellen geeignet. Konkreter
Inhalt: "... findet nahezu alle Bucharten: Belletristik,
Sachbücher, Nachschlagewerke, wissenschaftliche Abhandlungen, Lehrbücher,
Kinderbücher, naturwissenschaftliche und medizinische Fachbücher,
Schulbücher und noch viele mehr. Je mehr Bücher unserer
Bibliothekspartner wir hinzufügen, umso größer wird unser
Bestand. Sie werden also auch vergriffene, seltene und öffentlich zugängliche,
nicht mehr urheberrechtlich geschützte Bücher finden können.
... Wir respektieren das Urheberrecht und die Arbeit der Autoren. Daher sehen
Sie nur einen geringen Teil – in einigen Fällen nur einige wenige
Sätze – von Büchern, die urheberrechtlich geschützt sind.
Wenn ein Buch nicht den urheberrechtlichen Beschränkungen unterliegt
und öffentlich zugänglich ist, können Sie das gesamte Buch
durchsuchen. Prinzipiell möchte Google ... Ihnen dabei helfen, Bücher
zu entdecken, und nicht dabei, sie von Anfang bis Ende zu lesen. Dies ist
vergleichbar mit dem Herumschmökern in einem Buchladen – allerdings
mit dem besonderen Google-Touch." s. auch Faktendarstellung
durch google
- Internet
Archive: Metasuche über
digital aufbereitete Sammlungen (Text, Bild, Audio, Film), überwiegend
USA-Fokus; Zugangang zu kostenfreien, historischen Quellen aller Fachrichtungen;
Zusatz-Feature: die Internet Wayback Machine: Archivierung und Anzeige von
Webseiten (seit 1996)
B. Fachliche Repositorien
/ Dokumentenserver
- Online-Dienste, die vornehmlich
OA-Dokumente bereithalten (und nicht nur verlinken!). Beispiele ...
- ArXiv:
Dokumentenserver für Preprints aus den Bereichen Physik, Mathematik,
Informatik, Statistik, Finanzmathematik und Biologie. Dient als Ausgangspunkt
für viele wissenschaftliche Suchmaschinen; über 1,5 Mio Dokumente,
die alle als OA zur Verfügung stehen
- CiteSeerX:
Suchmaschine für OA-Dokumente aus dem Gebiet der Informatik/Informationswissenschaft
(über 10 Mio); mit Zitationsdatenbank-Funktion
- SlideShare:
hostet (wissenschaftliche) Präsentationen / PPT-Foliensätze
aus Forschung und Lehre; gut für Grundlagenrecherchen (Stand der
Forschung) geeignet
- Angebote von Wissenschaftsverlagen
(überwiegend kostenpflichtig). Beispiel ...
- Springerlink:
"Diese Plattform bietet Wissenschaftlern Zugang zu Millionen wissenschaftlicher
Inhalte und Fachinformationen aus Zeitschriften, Büchern, Buchreihen,
Laborprotokollen, Nachschlagewerken und Konferenzbeiträge" (über
15 Mio Dokumente)
C. Discovery Services als
Bestandteil von Bibliothekskatalogen (Recherche nach "Artikeln und mehr")
und Meta-Kataloge
- ermöglichen nicht
nur die Recherche im örtlichen Bibliothekskatalog, sondern auch den Zugriff
auf weitere (überwiegend kostenfreie) Dokumente, wie Zeitschriftenartikel,
Buchkapiteln, E-Books etc.; diese zusätzlichen Metadaten stammen immer
von kommerziellen Datenbankanbietern; Beispiele ....
- EBSCO Discovery Service:
Volltexte, Abstracts und/oder Metadaten von ca. 50.000 Zeitschriften,
6 Millionen Monographien, 20.000 Proceedings und 825.000 CDs und DVDs
- Katalog
des Medienzentrums der h-da
- PRIMO (Exlibris):
umfasst ca. 100 Mio. Datensätze und wächst, nach Angaben des
Betreibers, kontinuierlich. Im Index enthalten sind schwerpunktmäßig
englischsprachige E-Books und Aufsätze aus etwa 150.000 Zeitschriften
- Metaverzeichnis - KVK:
"Buchsuchmaschine zum Nachweis von mehreren hundert Millionen Medien
in Katalogen weltweit"; berücksichtigt neben Bibliothekskatalogen
auch Buchhandelsverzeichnisse sowie wiss. Suchdienste (BASE, DOAJ) sowie Google
Buchsuche
D. (kostenpflichtige)
Fachdatenbanken
- erschließen überwiegend
Zeitschriftenaufsätze nach informationswissenschaftlichen Grundsätzen
(Inhaltserschließung mit Abstract, Deskriptoren/Schlagwörtern)
zu einem Fachgebiet; umfangreiche Suchfunktionalitäten klassischer qualitätsgeprüfter
Online-Datenbanken, Beispiel ....
- Ingenta:
freie Datenbank mit über 10 Mio Aufsätzen aus allen Fachgebieten,
häufig sind nur die Abstracts und Inhaltsverzeichnisse kostenlos
verfügbar; angeschlossener Dokumentlieferdienst
- PubMed:
"PubMed comprises more than 36 million citations for biomedical literature
from MEDLINE, life science journals, and online books. Citations may include
links to full-text content from PubMed Central and publisher web sites"
- Datenbankführer:
Datenbank- Infosystem - DBIS
- welche Datenbank gibt es überhaupt? (auch Hinweis auf kostenfreie
Datenbanken)
E. weitere wiss. Suchdienste:
Fachportale / Fachinformationsdienste (FID) - Dienstleistungen wiss. Bibliotheken
Definition ...
- verzeichnen grundlegende
Internetressourcen für mehrere oder einzelne Fach- bzw. Wissenschaftsgebiete.
Sie werden (fast) immer von fachlich kompetenten Bibliothekaren/Dokumentaren/Informationsspezialisten
zusammengestellt und
- haben eine fachliche
Portalfunktion
- enthalten immer
eine fachliche Linksammlung (Webkatalog / Fachinformationsführer)
u. bieten zusätzlich den Zugriff auf ...
- Kernmodule
- spezielle fachliche
Suchmaschinen
- Metasuche in
Fach-OPACs und z.T. auch Fachdatenbanken mit (teilweise kostenpflichtigem)
Zugriff auf elektronische Publikationen
- Dokumentlieferung
- mögliche
Erweiterungsmodule, z.B.:
- Volltextdatenbanken
/ Volltextserver
- Elektronische
Fachzeitschriften
- Weitere fachlich
relevante bibliographische Datenbanken bzw. Fakten-Datenbanken, z.B.
- Tagungskalender
- Konferenztermine
- Kompetenznetzwerke
- Tutorials
- Newsletter
Beispiele
...
- Ingenieur- und
Naturwissenschaften
- Medizin- und
Biowissenschaften
- Rechts-, Wirtschafts-
und Sozialwissenschaften
- Geistes- und
Kulturwissenschaften
(optional:) Soziale Wissenschafts-Netzwerke
- Online-Dienste, die Wissenschaftler*innen
die Hinterlegung von eigenen Personenprofilen mit Angabe über Publikationen,
Preprints und andere Dokumente ermöglichen und damit auch die Vernetzung
bzw. den Austausch von Dokumenten bieten. Häufig erhält man nicht
nur zu OA-Dokumenten, sondern auch zu weiteren (kostenpflichtigen) Dokumenten
Zugang und erfährt, welche Personen ein bestimmtes Forschungsthema gerade
bearbeiten; Beispiel ...
- ResearchGate:
"connects you with other researchers, helps you discover content
valuable to your work, and lets you make your own research visible. Here's
how:
- Connect with
colleagues, co-authors, and specialists in your field
- Add your research
to your profile to make it discoverable by other researchers
- Add your current
project to your profile to share updates and get feedback on what
you're working on
- Access publications
and other work in your field and from your network
- Ask research-related
questions and get answers from experts
- Share your knowledge
and expertise by answering questions
- Get stats on
your work and find out who's been reading and citing it
- Explore the latest
jobs matched to your researcher profile
- Share your preprints
and other early work to get feedback from others before you publish
it"
(optional:) Wissenschaftliche
Suchdienste mit KI
Literatur- und Quellenhinweise
für die Projektgruppen ....
Basis-Quellen
- Lewandowski, Dirk: Suchmaschinen,
in: Kuhlen, Rainer et al. (Hrsg.): Grundlagen
der Informationswissenschaft, Berlin 2023, Kap. C 3 (guter erster Überblick)
- Quirmbach,
S.M.: Suchmaschinen, User Experience, Usability u. nutzerorientierte Website-Gestaltung,
insbesondere ....
- Kap. 6, ab S. 57:
User Experience u. Usability in Suchmaschinen
- Kap. 8, ab S. 81:
User Experience u. Usability messen
- Kap. 10: ab S. 95:
Vorbereitung zum Testen
- Kap. 11, ab S. 105:
Evaluationsmethoden im Überblick
- Kap. 12, ab S. 127:
Ergänzende Evaluationsmethoden speziell für Suchmaschinen
- Kap. 15, ab S. 159:
Checkliste für User-Experience-Maßnahmen
- Hanekop,
H.: Wandel des wiss. Publikationssystems durch das www? Die Wirkung wiss.
Suchportale und Suchmaschinen (2014)
- Droese,
K: Informationsverhalten
im Kontext wissenschaftlicher Arbeit, in: Bibliothek. Forschung u. Praxis
36 (2012), S. 94-103
- Benutzungstipps
Google Scholar
(topcorrect) sowie von der WU Wien "Recherche
im Internet"
- Gusenbauer,
M: Google Scholar to overshadow them all? Comparing the sizes of 12 academic
search engines and bibliographic databases, in: Scientometrics (2019), S.
177-214
- Baecker
et al.: BASE (Bielefeld Academic Search Engine). Eine Suchmaschinenlösung
zur Indexierung wissenschaftlicher Metadaten, in: Datenbankspektrum (2017),
S. 5-13
Erste Hinweise für
Team 1
Erste Hinweise für
die Teams 2 und 3
- Lewandowski
(2007):
Qualitätsmessung bei Suchmaschinen, system- und nutzerbezogene Evaluationsmaße
(Qualität des Index, der Suchresultate, der Suchfunktion, Usability)
- Lewandowski
(2011): Evaluierung von Suchmaschinen (Retrieval-Effektivität
mittels Juroren, Klicktest anhand von Logfiles, Protokollbasierter Test mit
sessionbasierter Evaluierung)
- Lewandowski
(2012): A framework for evaluating the retrieval effectiveness of search
engines (5 Aspekte: a) Query Selection b) Results Collection c) Results
Presentation d) Results Judgement und e) Data Analysis)
- Lewandowski
(2013): User Experience versus Retrievaltests - wie lässt sich die
Relevanz von Suchergebnissen bewerten? (Vortrag)
- Pieper/Wolf
(2009): Wissenschaftliche Dokumente in Suchmaschinen (Beschreibung
der wiss. SM nach Raster: Index, Suchmöglichkeiten, Trefferliste u. Weiterverarbeitungsmöglichkeiten;
10 Suchanfragen des Logfiles von BASE ausgewählt u. an alle wiss. SM
gesendet, die jeweils ersten 10 Treffer ausgewertet - und vergleichend aufgelistet
pro SM nach: Individuelle Dokumente (ohne Dubletten), davon abrufbare Dokumente,
davon im Volltext abrufbar)
- Kaluzza
(2013): Google scholar versus EBSCO Discovery Service - ein vergleichender
Retrievaltest (gutes Beispiel für sog. "known item search")
- Günther
(2012): Evaluierung
von Suchmaschinen, Qualitätsvergleich von Google- und Bing-Suchergebnissen
...
- Hermann
(2010): Möglichkeiten und Grenzen von Suchmaschinen bei
der wissenschaftlichen Recherche im Internet (Magisterarbeit, HU Berlin, IBI;
Retrieval-Effektivitätstest mit je 10 selbstgewählten Suchanfragen
u. Check auf Dubletten, Tote Links sowie direktem Zugang zum Volltext; allerdings
ohne weitere Relevanzprüfung!)
- Rhoden
(2018): Konzeption, Entwicklung u. Evaluation einer Web-Oberfläche
für die wiss. Bildersuchmaschine NOA (Bachelorarbeit, HS Hannover, Fak.
III Information, Medien, Design, Abteilung Information u. Kommunikation)
Erste Hinweise für
Team 4
- Software zur Aufzeichung
/ Protokollierung von Bildschirminhalten:
snagit (Testversion für 15 Tage gratis)
- Hastik/Schuster/Knauerhase
(2009):
Wissenschaftliche Suchmaschinen, Usability Evaluation u. Betrachtung des Suchverhaltens
potentieller Nutzer (Usability-Test durch Experten-Evaulation gemäß
Kriterienkatalog, Informationssuchverhalten ausgewählter Probanden eruiert
mit Evaluationsbogen und Mitschnitt aller am Bildschirm durchgeführten
Aktionen; Bearbeitung von drei Anfragen durch die Probanden)
zurück zur
Startseite
Copyright: B. Meier