Im Rahmen der DFG-geförderten Nationalen Forschungsdateninfrastruktur (NFDI)1 beteiligen sich derzeit knapp 30 Konsortien daran, eine nachhaltige Forschungsdateninfrastruktur für die deutsche Wissenschaft aufzubauen. Die NFDI4Memory2 ist dabei für die historisch arbeitenden Disziplinen zuständig, also die Geschichtswissenschaft im engeren Sinne, aber auch die historischen Zweige vieler anderer Fächer wie Philosophie/Ideengeschichte, Religionswissenschaft/Kirchengeschichte, Rechtsgeschichte oder eben die historisch arbeitenden Area Studies. In der NFDI4Memory wird etwa zu Datenqualität, Metadatenstandards, Datenspeicherung und -nachnutzung oder Datenverlinkung gearbeitet, das Konsortium möchte aber auch die historische Quellenkritik ins digitale Zeitalter übersetzen und eine neue Datenkultur fördern. Es bringt Akteure aus über einhundert Institutionen zusammen, darunter Forschungseinrichtungen ebenso wie Gedächtnisinstitutionen, und es möchte die Verbindungen zwischen diesen „Produzenten“ und „Nutzenden“ von Daten stärken.
Das Research Centre Global Dynamics der Universität Leipzig widmet sich im Rahmen der NFDI4Memory speziell den Besonderheiten, die eine Dateninfrastruktur für die Area Histories mit sich bringt. Das entsprechende Teilprojekt ist im Bereich Data Literacy angesiedelt, den insgesamt die Universität Trier verantwortet, und diskutiert die technischen, rechtlichen, und ethischen Dimensionen, die zu berücksichtigen sind, wenn Wissenschaftler und Wissenschaftlerinnen aus Deutschland in oder zu anderen Ländern und Weltregionen forschen und dort Daten für ihre Forschung erheben und/oder nutzen. Die Ergebnisse werden nicht zuletzt in Form von Handreichungen für die Community aufbereitet.
Die Nutzung von Daten aus nicht-europäischen Kontexten zu reflektieren war zweifellos schon immer notwendig. In den vergangenen 20 Jahren ist es jedoch noch wichtiger geworden, da sich erfreulicherweise das Interesse der deutschen Geistes- und Sozialwissenschaften an Forschungsgegenständen jenseits des nationalhistorischen Rahmens und häufig mit transregionaler oder gar globaler Dimension intensiviert hat. Zudem zeigen immer mehr Historiker und Historikerinnen ein Interesse an nicht-europäischen Wirtschafts-, Kultur- oder politischen Räumen, um Fragestellungen und Forschungsperspektiven auf Verflechtungen, Kulturtransfers und global bzw. transregional angelegte Vergleiche zu bearbeiten. In allen diesen Fällen ist es mit Blick auf analoges und vor allem auch digitales Quellenmaterial aus den untersuchten Weltregionen wichtig, sich mögliche Unterschiede hinsichtlich der Nutzung und der Verfügbarkeit je nach regionalem Kontext zu vergegenwärtigen.
Archive (im weitesten Sinn des Wortes) und die sich darauf gründende Forschungslandschaft sind auf je Area-spezifische Weise miteinander verflochten: Archive entstanden sicherlich nicht primär für die Zwecke von Historikerinnen und Historikern, sondern eher, um Schriftgut und andere Artefakte für spätere politische, administrative oder andere gesellschaftliche Zwecke geordnet aufzubewahren, aber die historische Forschung hat im Laufe der Zeit den Zustand und die Ausrichtung von Archiven, ihre Nutzbarkeit und Erschließung mit beeinflusst. Dies ist jedoch vorrangig natürlich im jeweils eigenen Land der Fall, wo die Verflechtung von Überlieferung und historischer Forschung besonders eng ist – inhaltlich und personell. Für die NFDI4Memory-Initiative hat dies Folgen: Zum einen gilt es sich auf den grundlegenden Wandel, der mit der Digitalisierung einhergeht, hinsichtlich der Überlieferung historischer Artefakte jeglicher Art mit Bezug zur nationalen Geschichte bzw. jener Geschichte, die im Einzugsbereich der heute unter deutscher Verantwortung stehenden Überlieferungsinstitutionen dokumentiert wird, einzustellen. Dies erfordert einen systematischen Zugriff auf die Gesamtheit der Überlieferungen und die darauf bezogene Forschung tut gut daran, auch die Digitalisierung von Überlieferungen im Blick zu behalten, zu denen eventuell gegenwärtig keine Forschungen laufen, die aber künftig (wieder) von Interesse sein können.
Etwas anders stellt sich die Lage für die grob und knapp als Area Histories zusammengefassten Überlieferungszusammenhänge dar. Die Archive, Museen und Sammlungen liegen außerhalb der gesetzgeberischen und wissenschaftspolitischen Verantwortung der Bundesrepublik. Ein Vollständigkeitsprinzip bei der Analyse dieser Daten ist für die mit diesen Beständen arbeitenden Wissenschaftlerinnen und Wissenschaftler in den allermeisten Fällen von vornherein aus Ressourcengründen illusorisch. Über die Digitalisierung von Beständen (ebenso wie über die Zugänglichkeit der Originale und der Digitalisate) entscheiden andere, wo nicht von Deutschland aus initiierte Forschungs- oder Archivierungsprojekte eine begrenzte Digitalisierung betreiben oder unterstützen.3 Transnationale und transregionale Forschungsansätze haben allerdings in den letzten Jahren mit wachsender Dringlichkeit darauf aufmerksam gemacht, dass diese Überlieferungen (bereits jetzt oder jedenfalls potenziell) hoch bedeutsam auch für das Orientierungswissen in der deutschen Gesellschaft sind. Dies hat auch zu einer erhöhten Aufmerksamkeit für die Verflechtung von Beständen in deutscher und in ausländischer Archivverantwortung geführt, besonders im Bereich der Kolonialgeschichte.4
Die DFG hat auf diesen Unterschied bereits mit mehreren Anpassungen ihrer Politik zur Verfügbarmachung von Material für die Forschung über ferne und nicht so ferne Länder besonders für die Bibliotheksressourcen reagiert. Traditionelle Sammelschwerpunkte, die sog. Sondersammelgebiete, wurden ab 2014 durch Fachinformationsdienste (FID) ersetzt, der Aufmerksamkeit für Gedrucktes diejenige für Digitales hinzugefügt und, das vielleicht die gravierendste Neuerung, den Bibliotheken aufgetragen, sich mit einer Wissenschaftscommunity zusammenzuschließen, um für deren vorrangig aktuelle Bedürfnisse auszuwählen und zu sammeln. Was als Reorganisation daherkommt, ist auch das Eingeständnis, dass die Ressourcen nicht reichen, um alles zu sammeln und zu dokumentieren. Und für die Formulierung von Kriterien gibt es keine Zentralinstanz, sondern nur die Schwarmintelligenz der am Forschungsprozess Beteiligten.
Die Reform hin zu FID wurde vor dem Start der NFDI angestoßen, aber da sie im Bereich der Area Histories auf eine ähnliche Problemlage reagiert, lohnt es sich aus unserer Sicht, nach parallelen Erfahrungen und nach Synergieeffekten zu schauen. Die wichtigsten Fragen, die sich im Rahmen von NFDI4Memory nun stellen, werden im Folgenden erläutert.
Die Auffassungen von Quellenzugang, auswertung und veröffentlichungspraktiken, die im Bereich der Area Histories eben nicht zwingend an den deutschen Regeln ausgerichtet sind, müssen berücksichtigt werden. Dies bedeutet nicht, sich mit jeder willkürlichen Zugangsbeschränkung abzufinden, aber es gehört eben doch auch ganz zentral zur Data Literacy, die Überlieferungsmodi in verschiedenen Kontexten zu respektieren. Ein beschränkter Zugang zu lokalen Archiven und Bibliotheken mag Historiker:innen aus Deutschland wie Zensur erscheinen, für die lokalen Akteure aber in ihrem Verständnis von Archivzugang oder anderen Ursachen begründet liegen. Damit in Zusammenhang stehen unterschiedliche Erschließungstraditionen inkl. abweichende Metadatenstandards in technisch-infrastruktureller Hinsicht. Eine ganz wesentliche Rolle spielen auch die ungleichen Zugänge zu finanziellen und technischen Ressourcen, die sich in Asymmetrien beim Speichern und Auswerten von Quellen zeigen. Zudem ist das Thema Mehrsprachigkeit zentral für viele Area Historians. Während digitale Ansätze zu Quellen in englischer und in geringerem Maße in anderen weltweit dominierenden Sprachen weit gediehen sind, sind die verfügbaren Ressourcen für andere Sprachen, vor allem solche mit nicht-lateinischen Schriftzeichen, deutlich beschränkter.
Im Umgang mit Forschungsdaten sind zudem einige rechtliche Fragen zu beachten, vor allem im Bereich des Urheberrechts und des Datenschutzes. Dies ist ein umso schwierigeres Unterfangen im inter- und transnationalen Kontext, wenn ganz unterschiedliche Regelungen und bisweilen sogar ganze Rechtstraditionen gleichermaßen beachtet werden müssen. Sowohl die Erhebung von Daten als auch deren Zugänglichkeit werden unterschiedlich reguliert und dabei bestehen auch innerhalb einzelner Länder große Unterschiede, etwa zwischen staatlichen und privaten Archiven.
Und final stellt die Nutzung und der Umgang mit Daten aus nicht-europäischen Weltregionen Historiker und Historikerinnen zudem immer wieder vor ethische Herausforderungen. Wer entscheidet, wo Daten abgelegt werden und wer sie benutzen darf? Wer darf welche Fragen an das Material stellen? Wie verhalten wir uns, wenn lokale Archive in finanzielle Not geraten? Diese und weitere Fragen führen uns mitten in die Debatten über die Notwendigkeit der Dekolonisierung des Wissens und die Rolle, die europäische bzw. westliche Institutionen, Regelsysteme, Katalogisierungsprinzipien, Archivordnungen etc. bei der Perpetuierung kolonialer Denkmuster und Systematiken spielen.
Vor dem Hintergrund dieser Herausforderungen lag es nahe, einen Austausch zwischen verschiedenen Akteuren der deutschen Wissenslandschaft zu organisieren. Im April 2024 kamen Vertreterinnen und Vertreter der Area-bezogenen und verwandten Fachinformationsdienste mit Mitgliedern der NFDI4Memory zu einem Workshop in Leipzig zusammen. Dieser Workshop verfolgte zwei zentrale Ziele:
- Spezifische Bedarfe und Charakteristika der Area Histories aufzeigen, welche für den Aufbau von Dateninfrastrukturen in Deutschland sowie für die Entwicklung einer digitalen Quellenkritik notwendigerweise zu berücksichtigen sind; darauf basierend
- eine sinnvolle Identifizierung und ggf. Abgrenzung von Zuständigkeitsbereichen, basierend auf den vorhandenen Kompetenzen und bereits existierenden Tätigkeitsfeldern, zwischen den FID und der NFDI4Memory auszuloten und vorzuschlagen.
Das Gespräch war nicht nur außerordentlich angenehm und interessant, sondern auch ideenreich und voller Informationen, von denen wir glauben, dass sie einem breiteren Kreis von Leserinnen und Lesern nicht vorenthalten werden sollten. Wir haben uns entschieden, eine Reihe in der Zeitschrift Connections zu etablieren, weil damit einerseits die Community gut erreicht werden kann: Connections hat immerhin mehr als 15.000 Abonnenten und Abonnentinnen im Bereich der Area Histories. Eine elektronische Publikation erschien uns auch deshalb geeignet, weil die erwartbar zahlreichen Links auf andere Veröffentlichungen im Netz einfach zu handhaben sind. Und schließlich erlaubt das Reihenformat, später noch weitere Interventionen und Kommentierungen hinzuzufügen. In den ersten Artikeln werden die FID ihre Arbeit in Bezug auf die oben genannten Punkte sowie Angebote im Bereich Forschungsdatenmanagement (FDM) – z.B. Diskussionsforen, Infrastrukturen, Beratung, Entwicklung von Standards – und ihre bisherigen NFDI-Kooperationen vorstellen. Dieser einleitende Text bietet zunächst einen Überblick über die zentralen Themenfelder.
Definition: Texte, Bilder, Quellen – was sind eigentlich Forschungsdaten?
Das Konsortium NFDI4Memory stützt sich in seiner Arbeit auf einen eher weiten Forschungsdatenbegriff, der sich u.a. an der Definition orientiert, die das Glossar von forschungsdaten.info (Universität Konstanz) anbietet: „Forschungsdaten […] [sind] (digitale) Daten, die während wissenschaftlicher Tätigkeit (z. B. durch Messungen, Befragungen, Quellenarbeit) entstehen. Sie bilden eine Grundlage wissenschaftlicher Arbeit und dokumentieren deren Ergebnisse.“5 In den historisch arbeitenden Fächern umfasst das ein breites Spektrum an Datentypen und -arten: Metadaten, bibliographische Daten, Kataloge, Bild-Digitalisate analoger Daten und Quellen, digitale Objekte, Volltexte und Transkriptionen, angereicherte Volltexte, Interviews, Bilder, Filme, Musik, Noten, Normdaten, kontrollierte Vokabularien, Ontologien, Annotationen, Kollationen, Kommentierungen, Exzerpte etc.6
Aus diesem forschungsbasierten und damit immer auch projektspezifischen Verständnis von Forschungsdaten resultiert der Umstand, dass es sehr unterschiedliche Anforderungen an die Aufbereitung, Verarbeitung und Verwaltung von Forschungsdaten – dem sogenannten Forschungsdatenmanagement – gibt. FDM meint die Organisation und Pflege der Daten durch den gesamten Forschungskreislauf hindurch und zwar von der Planung über die Projektdurchführung, Ergebnispublikation bis zur abschließenden Datenarchivierung und/oder -publikation. Ziel ist es, nachvollziehbare (ggf. replizierbare) Forschungsergebnisse zu erzeugen, die in neuen Vorhaben nachgenutzt werden können.
Dieses Verständnis von Forschungsdaten und FDM und ihre Umsetzung sind hoch voraussetzungsvoll. Sie verlangen vom Wissenschaftler bzw. der Wissenschaftlerin ein hohes Maß an Datenkompetenz – also: Data Literacy. Dabei besteht auch innerhalb des Konsortiums noch weiterer Abstimmungsbedarf bzgl. der verschiedenen Facetten von Forschungsdaten, denn der Begriff sollte möglichst inklusiv sein und die unterschiedlichen Verarbeitungsstufen von Forschungsdaten berücksichtigen. Es ist vermutlich auch eine Differenzierung notwendig zwischen Forschungsdaten als Minimaldatensätze und umfassend kuratierten Datensätzen. Hier liegt ein interessanter Ansatzpunkt für die Diskussion von Abgrenzungen, Kooperation und Synergien zwischen FID und der NFDI.
Denn auch unter den FID gibt es noch kein einheitliches Verständnis von Forschungsdaten, wie die Diskussionen im Rahmen des Workshops zeigten. Hier ist ein Feld, in dem weiterführende Abstimmungsprozesse nötig sind. So etwa auch ganz grundsätzlich zu der Frage, ob die Quellen selbst bzw. deren digitale Repräsentationen als Forschungsdaten betrachtet werden sollten – eine Auffassung, die in der NFDI4Memory tendenziell vertreten wird, aber auch nicht unumstritten ist7 – oder aber nur das, was von den Forschenden selbst geschaffen wird, also etwa Annotationen, Bibliographien oder Interviews. Es ist klar, dass die unterschiedlichen Antworten auf diese Frage einerseits fundamentale epistemologische Differenzen freilegen und andererseits enorme praktische Konsequenzen für das Sammeln, Ordnen, Klassifizieren und Wiedernutzen haben. Für die Area Histories spitzt sich diese Frage noch einmal spezifisch zu, wenn meist nur eine Auswahl von Quellen, die stark durch das temporäre Forschungsinteresse der einzelnen Historikerin oder des Historikers geprägt ist, in die in Deutschland beheimateten Repositorien übergeht.
Infrastruktur: FAIRe Daten, gemeinsame Datenräume und Multilingualität
Die Befähigung der historisch arbeitenden Wissenschaftler und Wissenschaftlerinnen, selbst erhobene oder produzierte Forschungsdaten so zu beschreiben, dass die Entstehung der Daten transparent wird, dass Dritte und möglicherweise auch fachfremde Personen sie weiter nutzen können und dass sie so weit standardisiert ausgezeichnet werden, sodass ein Austausch mit anderen Systemen möglich ist, ist eine große Aufgabe, die zum Tätigkeitsfeld des NFDI-Konsortiums 4Memory gehört.
Mit Blick auf die Tätigkeitsfelder der FID wird deutlich, dass einige FID ihre Kernaufgabe u.a. im Bereich der „Findability“ von Daten, Dokumenten und Literatur aus den Weltregionen, die sie vertreten, sehen. Der FID Nahost-, Nordafrika- und Islamstudien geht sogar so weit zu argumentieren, dass es eine klare Arbeitsteilung zwischen FID und den Forschenden bezüglich der Verantwortlichkeit für die Realisierung der FAIR-Prinzipien (Findable / Auffindbar, Accessible / Zugänglich, Interoperable / Interoperabel und Reusable / Wiederverwendbar)8 geben sollte (siehe Beitrag von Jeschke/Adam in dieser Serie). Während die FID auch aufgrund der hier vertretenen bibliothekarischen Kompetenz einen Auftrag haben, die Auffindbarkeit von Daten durch die Vergabe von eindeutigen und dauerhaften Kennungen, die Beschreibung von Daten mit kontrollierten Metadaten und die Registrierung der Daten und Metadaten in durchsuchbaren Ressourcen zu garantieren, sieht er die Aufgabe der Forschung darin, im Forschungsprozess die erhobenen und produzierten Daten so zu managen und zu kuratieren, dass sie zugänglich, interoperabel und wiederverwendbar werden.
Andere FID hingegen sind bereits im Aufbau von Infrastrukturen und in der Entwicklung von Workflows und Standards aktiv geworden und sehen sich als zentraler Partner für das Forschungsdatenmanagement auf ihrem Fachgebiet. So etwa der FID Ost-, Ostmittel- und Südosteuropa, der über einen eigenen Projektantrag gemeinsam mit verschiedenen Forschungsinstitutionen das Forschungsdatenrepositorium OstData aufbaut und bereits umfassende Materialien zur Datenkuration (Metadatenstandards, Datenmanagementplan etc.) erstellt hat (siehe Beitrag von Štanzel/Reuster). Gleiches gilt für den FID Sozial- und Kulturanthropologie, welcher zentral an Aufbau und Betrieb des Forschungsdatenzentrums Qualiservice beteiligt war und ist. Der an der Universität Bremen beheimatete und von Soziologen und Soziologinnen initiierte Qualiservice hat sich der Handhabe von qualitativen Forschungsdaten verschrieben und die Infrastruktur, Standards und Workflows entwickelt, welche den besonderen Eigenschaften qualitativer und häufig sensibler Daten gerecht wird (siehe Beitrag von Imeri). Das CrossAsia-Portal wiederum bietet u.a. die Möglichkeit, Forschungsdaten auf dem allgemeinen Publikationsserver zu veröffentlichen (siehe Beitrag von Paterson). Und der FID Südasien betreibt einen eigenen Bereich auf dem Forschungsdatenrepositorium der Universität Heidelberg zur Sammlung von sog. Ground-Truth-Daten zur automatischen Texterkennung südasiatischer Schriften sowie ein Bildarchiv (siehe Beitrag von Merkel-Hilf).
Viele FID bieten auch Beratungstätigkeit im weiteren Feld des Forschungsdatenmanagements an oder investieren selbst Ressourcen in die Tiefenerschließung von Forschungsmaterialien bzw. Forschungsdaten, die von Wissenschaftlern und Wissenschaftlerinnen im eigenen Forschungsprozess erhoben und dann als Vor- bzw. Nachlass an die FID übergeben worden sind (siehe Beitrag von Müller).
Diese fragmentierte Infrastrukturlandschaft, die freilich keineswegs auf die FID begrenzt ist, stellt eine zentrale Herausforderung für die NFDI-Konsortien dar. Auch im Rahmen des NFDI-Konsortiums 4Memory arbeitet ein eigener Arbeitsbereich an der Erstellung eines „Data Space“ für die historisch arbeitenden Disziplinen.9 Für Wissenschaftlerinnen und Wissenschaftler, die sich einem neuen Forschungsthema zuwenden und einen ersten Zugriff auf mögliche Quellenmaterialien und natürlich Forschungsliteratur suchen, ist ein integrierter Datenraum mit einem einzigen Einstiegspunkt und der Möglichkeit der Suche über verschiedene Datenrepositorien hinweg ein höchst bequemes und effizientes Instrument. So werden auch immer wieder Anfragen an die FID herangetragen, die auf die Integration der verschiedenen Suchsysteme abzielen. Solche Verknüpfungsprojekte sind in der Vergangenheit bereits diskutiert worden, allerdings mit wenig Erfolg. Es liegt nahe, den Grund dafür in dem oben skizzierten Unterschied hinsichtlich der Einwirkung auf die Überlieferungsmechanismen zu verorten, der einen weiten Bogen vom Anspruch auf systematische Erfassung zur relativ kontingenten Ausrichtung an den temporären Bedarfen einer spezialisierten Community spannt. In der Diskussion mit den Vertretern der FID wurde auch deutlich, dass die Integration von Daten in übergeordnete Datensysteme immer mit einem Verlust bezüglich der Granularität der Beschreibung der Daten einhergeht. Nichtdestotrotz gibt es freilich zahlreiche Bemühungen, die jeweiligen Bestände in aggregierende Systeme zu integrieren um eine bessere Auffindbarkeit zu gewährleisten (s. u.a. Beiträge von Müller; Štanzel/Reuster; von der Krone).
Eine weitere Herausforderung stellt die Multilingualität dar. Bis heute sind die technischen Herausforderungen des Umgangs mit Multilingualität ebenso wie Fragen der konzeptuellen Übersetzung bei der Erarbeitung mehrsprachiger Vokabulare und Thesauri nicht vollständig bewältigt (s. die Beiträge von Jeschke/Adam; Paterson; Štanzel/Reuster; von der Krone). Das gesamte Arbeitsfeld von Linked Open Data (LOD), die Semantik und Verknüpfung kodierter Datenpunkte über Technologien wie das Resource Description Framework (RDF) und darauf aufbauende Standards wie die Web Ontology Language (OWL) und die Abfragesprache SPARQL orientieren sich inhaltlich nach wie vor sehr stark an europäischen bzw. anglo-amerikanischen kategorialen Standards und lateinischen Schriftzeichen.10 Die Öffnung dieser Technologien für Wissensbestände aus außereuropäischen oder nicht-angelsächsischen Kulturräumen stellt diejenigen, die Software entwickeln, und Forschende gleichermaßen vor große Herausforderungen. Hier ist die NFDI deutlich stärker gefragt, Lösungen zu präsentieren, die die oben besprochenen und beschriebenen Notwendigkeit der Berücksichtigung von Area-spezifischen Formen der Data Governance einerseits und der Erschließungstiefe von Daten, Büchern und Archivmaterialien aus nicht-europäischen Kulturräumen durch die Vergabe von forschungsbasierten Metadaten und der Anreicherung dieser Daten durch Area-spezifisches Wissen andererseits unterstreichen.
Multilingualität und insbesondere die Verwendung nicht-lateinischer Schriftarten sind auch in anderen Bereichen digitaler Forschung eine Herausforderung, insbesondere im Bereich der Computerlinguistik. So sind etwa die Sprachressourcen und Softwarelösungen im Bereich des OCR/HTR stark auf dominante Sprachen ausgerichtet.11 In diesem Bereich bieten manche FID Lösungen und Unterstützung an, auch liegt eine Kooperation mit dem Text+-Konsortium nahe (siehe Beiträge von Merkel-Hilf; Paterson).
Ethik und Recht: Dekolonialisierung von Wissen und ein kritischer Blick auf Open Access
In der Workshopdiskussion wurde die Frage der Datenethik vor allem hinsichtlich des Aspekts Datenqualität diskutiert. Daten sollen möglichst gemäß den FAIR-Prinzipien mit standardisierten Metadaten sowie Normdaten und anderen kontrollierten Vokabularen generiert und beschrieben werden. Normierungen entfalten jedoch stets eine Wirkung bezüglich der damit repräsentierten Wissenswelten. Dies wird etwa an Normdaten- und Katalogisierungssystemen wie der Gemeinsamen Normdatei oder der Regensburger Verbundklassifikation besonders deutlich. Diese und andere kontrollierte Vokabulare sind niemals neutral, sondern sie sind historisch gewachsen und repräsentieren die Perspektiven und Deutungen des jeweiligen Entstehungskontextes. Dabei reproduzieren sie häufig eurozentristische Wissensordnungen und perpetuieren damit auch koloniale Weltbilder und Weltordnungen12, gegen deren Weiterverwendung sich zunehmende Skepsis aus der Gemeinschaft der Forschenden richtet.
Die Forderung nach der Dekolonisierung von Wissen steht damit in einem gewissen Spannungsfeld zum Gebot, Forschungsdaten zu normieren, um ihre Interoperabilität und Vergleichbarkeit zu ermöglichen. Dabei gilt es zu beachten, dass die Prozesse der theoretisch-methodischen Diskussion und ihrer Übersetzung in Normen für die Erfassung von großen Informationsmengen völlig unterschiedlichen Rhythmen folgen. Um es an einem Beispiel zu illustrieren: wohl niemand käme auf die Idee, seine Weltwahrnehmung Mitte der 2020er Jahre allein auf die Regensburger Systematik zu stützen, die seit ca. 1964 Einzug in deutsche Bibliotheken hielt und in Teilen weiterentwickelt wurde. Trotzdem ordnen Bibliothekare und Bibliothekarinnen, bei weitem nicht nur in Bayern, die Neuerwerbungen weiter entlang dieser Klassifikation ein. Es verlangt einige Flexibilität, um neue Forschungstrends wie die Verflechtungsgeschichte oder neue geopolitische Realitäten in solch eine mehr als Halbjahrhundert alte Klassifikation einzubauen. Diese Flexibilität (und ihre Akzeptanz bei jenen, die die Ordnung zu hüten beauftragt sind) lässt sich vermutlich befördern, wenn der Entstehungskontext und die seitdem durchmessene Entwicklungsstrecke hierzulande und in anderen Wissenschaftssystemen reflektiert wird.
Ziel muss es sein, bestehende Normdatensysteme zu ändern, zu erweitern und sie international besser zu verknüpfen. In diesem Bereich sind einige Fachinformationsdienste bereits seit längerem aktiv (s. dazu die Beiträge von Imeri; Jeschke/Adam; Paterson; Sindt; von der Krone). Diese Erfahrungen sollten unbedingt in die Erstellung des geplanten Metadatenschemas im Rahmen von NFDI4Memory einfließen.
Auch in der Debatte um den öffentlichen Zugang zu Forschungsdaten stellen sich ethische Fragen. Ausgehend von der Open-Access-Bewegung wird seit vielen Jahren auch der öffentliche Zugang zu Forschungsdaten gefordert.13 Zwar wird mit dem Leitsatz „so offen wie möglich, so geschlossen wie nötig“14 Spielraum bei der Verfügbarmachung eingeräumt, jedoch bezieht sich dies häufig auf rechtliche Einschränkungen wie den Datenschutz oder das Urheberrecht (s. unten).
Gerade auf dem Gebiet der Area Histories stellen sich mitunter noch komplexere Fragen: Wer hat die Hoheit über den Zugriff auf Daten und Materialien zu entscheiden, die in „Unrechtskontexten“ (z.B. in der Kolonialzeit) gesammelt wurden und heute digitalisiert werden?15 Wem gehören Daten in Kontexten, in denen divergierende Konzepte von Eigentum bestehen? Welche Rechte sollten beforschte Gruppen in Bezug auf die Verwaltung von Forschungsdaten haben? Wie gehen wir mit unterschiedlichen Konzepten von Persönlichkeits- und gruppenbezogenen Rechten um? Wie ist die Forderung nach Open Access vor dem Hintergrund globaler Macht- und Ressourcenasymmetrien in der akademischen Welt zu bewerten?16
Auch die „CARE-Prinzipien“ knüpfen an diese Themen an und fordern einen bedachten Umgang mit Daten, die in sensiblen Kontexten erhoben werden.17 Während sie sich auf die Rechte von indigenen Völkern, vertreten durch die Global Indigenous Data Alliance, beziehen, geben sie doch wichtige Impulse für einen ethischen Umgang mit Daten insgesamt, etwa auch mit Blick auf andere Minderheiten. Sie fordern auf, Machtdynamiken und (historische) Kontexte der Datenerhebung genauso zu reflektieren wie Mitbestimmung und Kontrolle in der Datenverwaltung durch die beforschten Personen zu ermöglichen (siehe Beiträge von Imeri; Merkel-Hilf; von der Krone).18
Aufgrund ihrer spezifischen Area-Kompetenz und der Kenntnisse von Akteuren in den unterschiedlichen Weltregionen stellen die FID zentrale Kompetenzen zur Verfügung, um das Spannungsfeld von Open Access, CARE-Prinzipien und Datenethik informiert auszuloten und Area-spezifische Lösungsansätze zu entwickeln. Und auch die NFDI4Memory hat bei der Konzipierung des Arbeitsprogramms für die Arbeitsbereiche „Data Literacy“ und „Data Culture“ die Frage des Umgangs mit Datenethik eine große Rolle gespielt. Darüber hinaus gibt es im Konsortium ein Sonderkomitee für ethische Fragen. Und auch der NFDI-Verein hat mit der Gründung der Sektion ELSA (Ethical, Legal, and Social Aspects) die Relevanz des Bereichs der Datenethik unterstrichen.19
Und schließlich sind auch die komplexen (und mitunter fehlenden) rechtlichen Grundlagen eine Herausforderung für die Forschung zu außereuropäischen Weltregionen. Forschende wie auch Mitarbeitende von GLAM-Institutionen sind mit einer Vielzahl von unterschiedlichen Rechtssystemen konfrontiert und klare Regelungen zum Austausch von Forschungsdaten über Landesgrenzen hinweg sind häufig nicht vorhanden. Das betrifft Fragen des Urheberrechts und anderen Regularien zum Schutze geistigen Eigentums wie auch den Schutz von personenbezogenen Daten, und dabei insbesondere den Schutz sensibler Daten (siehe Beitrag von Jeschke/Adam; Müller; Paterson; Štanzel/Reuster).
Hier hat die Diskussion auf eine klare Arbeitsteilung zwischen FID und NFDI hingewiesen. Experten und Expertinnen aus den FID sehen in der Frage der Rechtsgrundlagen für die Nutzung, Weitergabe, Speicherung und Publikation von Daten aus ihren jeweiligen regionalen Zuständigkeitsbereichen eine klare Grenze für ihre Beratungstätigkeit. Der gesamte Bereich der rechtlichen Grundlagen der Datennutzung erweist sich als so komplex, dass sogar eine Art „Verbot“ der Beratungstätigkeit diskutiert wird, denn Haftungsfragen sind hochgradig unübersichtlich. Dennoch besteht gerade in diesem Sektor großer Beratungsbedarf bei den Wissenschaftlerinnen und Wissenschaftlern, die nach Lösungen für ihre konkreten Forschungs- und Archivierungsbedarfe suchen. Für die NFDI ergibt sich ein großes Aufgabenfeld, das sich gar nicht allein auf die historisch arbeitenden Disziplinen bezieht, sondern überall dort nach Lösung verlangt, wo komplexe ethische und rechtliche Abwägungen zu treffen sind.
Die Beiträge in dieser Serie
Duncan Paterson, Forschungsdaten in den Area Histories: der FID Asien und die NFDI4Memory
Nicole Merkel-Hilf, Forschungsdaten in den Area Histories: der FID Südasien und die NFDI4Memory
Josef Jeschke und Volker Adam, Forschungsdaten in den Area Histories: der FID Nahost-, Nordafrika- und Islamstudien und die NFDI4Memory
Sabine Imeri, Forschungsdaten in den Area Histories: der FID Sozial- und Kulturanthropologie und die NFDI4Memory
Kerstin von der Krone, Forschungsdaten in den Area Histories: der FID Jüdische Studien und die NFDI4Memory
Christoph Müller, Forschungsdaten in den Area Histories: der FID Lateinamerika, Karibik und Latino Studies und die NFDI4Memory
Ruth Sindt, Forschungsdaten in den Area Histories: der FID Nordeuropa und die NFDI4Memory
Arnošt Štanzel und Jakob Reuster, Forschungsdaten in den Area Histories: der FID Ost-, Ostmittel- und Südosteuropa und die NFDI4Memory
Anmerkungen:
1 Nationale Forschungsdateninfrastruktur (NFDI), <https://www.nfdi.de/> (04.01.2025).
2 NFDI4Memory, <https://4memory.de/> (04.01.2025).
3 So z.B. das 2017 bis 2019 von der DFG geförderte Projekt zur Digitalisierung, elektronischer Erschließung und Online-Präsentation der Quellen zur deutschen Kolonialgeschichte in einer virtuellen Digitalen Sammlung Deutscher Kolonialismus, die sich aus Beständen der Staats- und Universitätsbibliothek Bremen und der Universitätsbibliothek Frankfurt zusammensetzt, sowie die anschließende Integration der Volltexte in die Forschungsinfrastruktur CLARIN-D, siehe <https://sammlungen.ub.uni-frankfurt.de/dsdk> (04.01.2025). Dies verband sich mit der Digitalisierung kolonialhistorisch relevanter Bibliotheken, siehe <https://www.bibliotheksverband.de/sites/default/files/2021-08/Digitale_Sammlung_Deutscher_Kolonialismus.pdf> (04.01.2025). Vgl. auch das Projekt in-context, das seit 2024 an der Staatsbibliothek zu Berlin koordiniert wird und die Finanzierung einer „zentrale[n] Plattform zur Erforschung historischer Quellen [einwerben soll, die] relevante Sammlungen in Deutschland und von internationalen Partnern präsentiert und zugänglich macht“, siehe <https://in-context.sbb.berlin/> (04.01.2025). Das Bundesarchiv wiederum bietet einen übersichtlichen Zugang zu seinen kolonialhistorisch bedeutsamen Quellen, siehe <https://www.bundesarchiv.de/im-archiv-recherchieren/archivgut-recherchieren/nach-themen/kolonialgeschichte/> (04.01.2025). Zudem sei hier auch das Portal Sammlungsgut aus kolonialen Kontexten der Deutschen Digitalen Bibliothek erwähnt, das die Metadaten zu Objekten aus deutschen Museen und anderen Sammlungen in einer zentralen Instanz zusammenführt, siehe <https://ccc.deutsche-digitale-bibliothek.de/> (04.01.2025).
4 Als ein eindrückliches Beispiel sei der deutsch-französische Fonds für Provenienzforschung erwähnt, der die Erschließung kolonialhistorischer Überlieferungen animiert und unterstützt, <https://cmb.hu-berlin.de/forschung/fonds-de-provenance> (04.01.2025).
5 <https://forschungsdaten.info/themen/informieren-und-planen/was-sind-forschungsdaten/> (04.01.2025).
6 Für die Definition von Forschungsdaten und FDM in den Geistes- und Kulturwissenschaften siehe auch Peter Andorfer, Forschungsdaten in den (digitalen) Geisteswissenschaften. Versuch einer Konkretisierung, DARIAH-DE Working Papers, Göttingen 2015. Fabien Cremer u.a., Data meets history: A research data management strategy for the historically oriented humanities, in: Gregor Feindt / Bernhard Gissibl / Johannes Paulmann (Hrsg.), Cultural Sovereignty beyond the Modern State. Space, Objects, and Media, Jahrbuch Für Europäische Geschichte / European History Yearbook, Berlin; Boston 2021, S. 155-178. Eva Ommert, Forschungsdatenmanagement im SFB 1199, SFB 1199 Working Paper Series, Leipzig 2023, <https://nbn-resolving.org/urn:nbn:de:bsz:15-qucosa2-885985>.
7 Johannes Paulmann u.a., NFDI4Memory. Consortium for the historically oriented humanities. Proposal for the National Research Data Infrastructure (NFDI), Zenodo 2022, S. 37, <https://doi.org/10.5281/zenodo.7428489>.
8 <https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/faire-daten/> (04.01.2025).
9 Für weitere Informationen zum NFDI4Memory-Data Space s. Silvia Daniel / Gregor Horstkemper / Arnost Stanzel, NFDI4Memory. Der Beitrag der Bayerischen Staatsbibliothek, in: Zeitschrift für Bibliothekswesen und Bibliographie 71 (2024), S. 61-69, <https://doi.org/10.3196/186429502471217>.
10 Gustavo Candela u.a., A linked open data framework to enhance the discoverability and impact of culture heritage, in: Journal of Information Science 45 (6) (2018), S. 756-766, <https://doi.org/10.1177/0165551518812658>.
11 Siehe auch Paul Spence, Disrupting Digital Monolingualism: A report on multilingualism in digital theory and practice (Project report). Language Acts and Worldmaking Project, Zenodo 2021, <https://doi.org/10.5281/zenodo.5743283>.
12 Siehe auch Yvonne Schürer, Decolonising the Library – in Deutschland?, in: Bibliothek Forschung und Praxis 47 (2023), <https://doi.org/10.1515/bfp-2022-0029> und Sabine Imeri / Moritz Strickert / Julia Zenker, Koloniale Kontexte in der Bibliothek. Vernetzen, Erschließen, Bereitstellen, Bibliothek Forschung und Praxis 48 (2024), <https://doi.org/10.1515/bfp-2023-0036>.
13 Für die unterschiedlichen Definitionen von Open Access und Archivierung siehe: <https://www.dfg.de/de/foerderung/foerdermoeglichkeiten/programme/infrastruktur/lis/open-access/was-ist-open-access#definitionen> (04.01.2025).
14 <https://open-research-europe.ec.europa.eu/for-authors/data-guidelines> (04.01.2025).
15 Siehe Daniela Agostinho, Archival encounters: rethinking access and care in digital colonial archives, in: Arch Sci 19 (2019), S. 141-165, <https://doi.org/10.1007/s10502-019-09312-0>.
16 Daniela Agostinho, Digital Humanities Within a Global Context: Creating Borderlands of Localized Expression, in: Fudan Journal of the Humanities and Social Sciences 11 (3) (2018), S. 357-369, <https://doi.org/10.1007/s40647-018-0224-0>. Siehe auch Kathleen Schlütter / Eva Ommert, Digital Monolingualism, Archives at Risk, and Global Views on Open Access, in: TRAFO – Blog for Transregional Research, 06.03.2024, <https://trafo.hypotheses.org/50712>.
17 Siehe Stephanie Russo Carroll u.a., The CARE Principles for indigenous data governance, in: Data Science Journal 19 (43) (2020), <https://doi.org/10.5334/dsj-2020-043>.
18 Siehe auch Sabine Imeri / Michaela Rizzolli, CARE Principles for Indigenous Data Governance: Eine Leitlinie für ethische Fragen im Umgang mit Forschungsdaten?, in: o-bib. Das offene Bibliotheksjournal 9 (2) (2002), S. 1-14, <https://doi.org/10.5282/o-bib/5815>.
19 Sektion Ethical, Legal and Social Aspects der NFDI, <https://www.nfdi.de/section-elsa/> (04.01.2025).