Forschungsdaten in den Area Histories: der Fachinformationsdienst Südasien und die NFDI4Memory

By
Nicole Merkel-Hilf, Bibliothek, Universitätsbibliothek/CATS Bibliothek, Universität Heidelberg

Ob bei der Arbeit im Archiv, bei der Feldforschung oder bei der Nutzung von Datenbanken – Forschungsdaten spielen eine zentrale Rolle in jedem Forschungsvorhaben. Im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI) entsteht derzeit eine Dateninfrastruktur für die deutsche Wissenschaft. Das Konsortium NFDI4Memory ist dabei für die historisch orientierten Disziplinen zuständig und arbeitet etwa zu Datenqualität, Metadatenstandards oder Datenverlinkung, es möchte aber auch die historische Quellenkritik ins digitale Zeitalter übersetzen und eine neue Datenkultur fördern. Das Research Centre Global Dynamics der Universität Leipzig widmet sich dabei den Besonderheiten, die sich für das Forschungsdatenmanagement in den Area Histories ergeben, und diskutiert die rechtlichen, ethischen und technischen Dimensionen, die zu berücksichtigen sind, wenn Wissenschaftler und Wissenschaftlerinnen in oder zu anderen Ländern und Weltregionen forschen und dort Daten für ihre Forschung erheben oder nutzen. Ein Workshop im Frühjahr 2024 brachte Vertreter und Vertreterinnen der areabezogenen Fachinformationsdienste sowie der NFDI4Memory zusammen, um die spezifischen Bedarfe der Area Histories herauszuarbeiten sowie die Zusammenarbeit und jeweiligen Zuständigkeitsbereiche von NFDI und FID zu diskutieren. Diese Artikelserie hält die zentralen Erkenntnisse dieses Gesprächs fest und wird zunächst die Arbeit der Fachinformationsdienste auf dem Gebiet der Forschungsdaten in den Fokus nehmen.
In diesem Artikel stellt der FID Südasien seine Arbeit und Angebote im Bereich der Forschungsdaten vor.

Ausgangslage

Die Universitätsbibliothek Heidelberg (UB HD) und das Südasien-Institut (SAI) der Universität Heidelberg mit seiner Bibliothek am Centre for Asian and Transcultural Studies (CATS) verantworten seit 2016 den Fachinformationsdienst (FID) Südasien, der von der Deutschen Forschungsgemeinschaft (DFG) im Rahmen des Förderprogramms „Fachinformationsdienste für die Wissenschaft“ gefördert wird, seit 2022 als eigenständiger FID4SA – FID Südasien.1 Dieser FID Südasien hat seit seiner Gründung effiziente und verlässliche Informations- und Serviceangebote mit hoher Relevanz für die südasienwissenschaftliche Fachcommunity entwickelt, und unterstützt mit seinen Dienstleistungen die spezifischen Bedürfnisse seiner heterogenen Fachcommunity2. Die geographische Region Südasien umfasst nach dem heutigen politischen Verständnis die Staaten Bangladesch, Bhutan, Indien, die Malediven, Nepal, Pakistan und Sri Lanka. Jedoch fungiert für diese Länder nicht nur die geographische Lage als Klammer, sondern auch eine gemeinsame Geschichte, die durch kulturelle, politische und religiöse sowie sprachliche Vielfalt gekennzeichnet ist. Der FID deckt durch seine verschiedenen Angebote und Dienstleistungen diese Bandbreite ab. So beinhaltet das Portfolio des FID die Erwerbung, Erschließung und überregionale Bereitstellung von gedruckten und digitalen Informationsressourcen für den wissenschaftlichen Spezialbedarf. Darüber hinaus fördert der FID4SA das Prinzip der Open Science durch national und international geschätzte und genutzte Services für Open-Access-Publikationen, wie Heidelberg Asian Studies Publishing (HASP) und FID4SA-Repository3. Zusammen mit weiteren Angeboten, wie z.B. im Bereich der Texterkennung für nicht-lateinische Schriften oder Normdatendiensten entsteht ein interoperabler Datenraum für die Südasienwissenschaften, der für Qualität, Konnektivität und Open Science steht.

Laut der Definition des Rats für Informationsinfrastrukturen sind Forschungsdaten „Daten, die im Zuge wissenschaftlicher Vorhaben entstehen, z. B. durch Beobachtungen, Experimente, Simulationsrechnungen, Erhebungen, Befragungen, Quellenforschungen, Aufzeichnungen, Digitalisierung, Auswertungen.“4 Die im Kontext der Südasienforschung mit ihren vielen Teildisziplinen entstehenden Forschungsdaten sind so vielfältig wie die Forschungsfelder und -methoden: Textdaten, Interviews, Transkriptionen, Fotografien, aber auch Geodaten, statistische Daten und vieles mehr fallen im Laufe des Forschungsprozesses an. Ein abgestimmtes oder standardisiertes Vorgehen speziell für die Südasienforschung zur nachhaltigen Archivierung und Nachnutzung von Forschungsdaten gibt es bisher nicht.5 Gespräche mit Forschenden zeigen jedoch, dass hier ein Umdenken stattfindet, nicht zuletzt angestoßen durch die Forderung vieler deutscher und auch europäischer Forschungsförderer nach verbindlichen Angaben zur nachhaltigen Archivierung, Bereitstellung und Nachnutzung der Daten gemäß der FAIR-Prinzipien6 nach Projektende. Inzwischen erreichen den FID Südasien vermehrt Anfragen aus dem Kreis der Südasienforschenden mit der Bitte um Unterstützung bei der Suche nach geeigneten Repositorien, bei der Erschließung von Materialien in südasiatischen Schriften und Sprachen, um die Auffindbarkeit in Suchsystemen zu gewährleisten, aber auch bei der Klärung rechtlicher Rahmenbedingungen, z.B. bei Urheber-, Persönlichkeitsschutz- und Nutzungsrechten. Der FID4SA versteht sich in diesem Zusammenhang als Vermittler zwischen Forschenden, Forschungsprojekten und Forschungsdatenzentren sowie NFDI-Konsortien, eine umfassende Beratung in rechtlichen Fragen liegt jedoch außerhalb seines Kompetenzbereichs.

Angebote des FID4SA im Bereich Forschungsdaten

Über die reine Vermittlungsfunktion hinaus adressiert der FID Südasien diese Bedarfe aus der Fachcommunity, indem er in engem Austausch mit Wissenschaftler:innen Angebote bereitstellt, um die Inhalte ausgewählter Projekte der Südasienforschung nachhaltig und langfristig zu sichern und mit anderen Angeboten zu vernetzen. Dabei profitiert der FID4SA von technischen und organisatorischen Synergien, die sich aus der Zusammenarbeit mit den beiden anderen von der UB Heidelberg verantworteten Fachinformationsdiensten7 ergeben. Die UB Heidelberg hat mit heiRIS – Heidelberg Research Infrastructure8 eine modulare digitale Infrastruktur für die Arbeit mit digitalen Medien und Texten, für Bildannotationen und Texteditionen sowie für wissenschaftliche Publikationen aufgebaut. Diese nachhaltigen Speicherorte und Präsentationsplattformen stehen auch der Fachcommunity des FID4SA zur Verfügung. Die Langzeitarchivierung der im Rahmen des FID anfallenden und über die heiRIS Module veröffentlichten Forschungsdaten erfolgt im Heidelberger Langzeitarchivierungssystem heiARCHIVE9, das die Archivierung von Rohdaten ermöglicht.

Auf Basis dieser umfassenden technischen Infrastruktur bietet der FID4SA seiner Fachcommunity neben der Veröffentlichung und Archivierung und dem Nachweis von Forschungsdaten, die im Kontext des elektronischen Publizierens im Open Access bei HASP und FID4SA-Repository entstehen, auch die Veröffentlichung und Archivierung von Ground Truth-Daten für die Texterkennung südasiatischer Schriften sowie FID4SA_images_ als Repositorium für Bildarchive an. Diese drei Angebote werden im Folgenden näher vorgestellt.

Forschungsdaten im Kontext des E-Publishing bei HASP

Im Bereich des elektronischen Publizierens im Open Access hat die UB Heidelberg in den vergangenen Jahren eine Infrastruktur aufgebaut, die nachhaltige Lösungen für das Publizieren von Monographien und Zeitschriften bietet.10 Neben der Gründung des Universitätsverlags heiUP – Heidelberg University Publishing11 im Jahr 2015 wurden umfangreiche Publikationsangebote für die Altertumswissenschaften, die Asienwissenschaften und die Kunstwissenschaften, also alle drei Fachinformationsdienste in Trägerschaft der UB Heidelberg, etabliert. Mit dem Aufbau wissenschaftsgetriebener Publikationsinfrastrukturen verfolgt die UB Heidelberg eine konsequente Open-Access-Strategie unter Wahrung technischer und formaler Standards.

Heidelberg Asian Studies Publishing (HASP)12 richtet sich mit seinem Angebot für das Publizieren im Open Access an Forschende in den asienbezogenen Wissenschaften weltweit. Im Jahr 2016 als CrossAsia-E-Publishing gegründet, wird die Publikationsplattform seit 2022 nach Beendigung der Kooperation mit der SBB Berlin beim FID Asien als Heidelberg Asian Studies Publishing fortgeführt. Der national und international stark genutzte Service ermöglicht die Publikation von Forschungsergebnissen in verschiedenen Formaten – im Vordergrund stehen die Publikation als E-Book im PDF-Format mit oder ohne Print-on-Demand Druckausgabe sowie XML-basierte Veröffentlichungen mit der Möglichkeit, die Publikation mit multimedialen (Forschungs-)Daten wie Bildern, Audio- und/oder Videosequenzen anzureichern. Diese zukunftsweisende Form des digitalen Publizierens ist besonders gut auf die Bedürfnisse von Wissenschaftler:innen zugeschnitten, deren Arbeit nicht nur textbasiert ist, sondern die sich bei ihrer Forschung auf multimediale Daten stützen. Die Forschungsdaten werden im Dataverse HASP@heiDATA13 publiziert und archiviert. Jeder Datensatz erhält zur eindeutigen Referenzierbarkeit einen DOI und ist mit der zugehörigen Publikation in HASP verlinkt und umgekehrt.


Abb. 1a: Monographische Publikation bei HASP


Abb. 1b: Zur Nachnutzung bereitgestellte Forschungsdaten auf den Dataverse HASP@heiDATA

Bei multimedialen Publikationen mit integrierten Bildern, Audio- und Videodateien oder auch 3-D Modellen werden die Dateien in der Heidelberger Objekt- und Multimedia-Datenbank heidICON veröffentlicht und gespeichert. Über einen Deep Link wird die Ressource in die XML-Version der Publikation eingebunden. Zur eindeutigen Referenzierbarkeit erhalten Multimedia-Dateien in heidICON eine DOI und URI auf Datensatzebene und werden mit umfangreichen Metadaten erschlossen. Darüber hinaus bietet heidICON die Interoperabilität und Nachnutzbarkeit durch den IIIF (International Image Interoperability Framework)14 Standard und erfüllt durch die Einbindung kontrollierten Vokabulars und Normdaten, wie GND, GeoNames und daiGazetteer zentrale Linked Open Data-Prinzipien.


Abb. 2: Sammelband bei HASP mit integrierten Audiodateien

Sowohl die Buchpublikation als auch die Forschungsdaten werden als eigenständige Veröffentlichungen im Verbundkatalog K10Plus nach bibliothekarischen Standards formal und inhaltlich erschlossen. Publikation und Forschungsdaten sind damit auffindbar, zugänglich, interoperabel und nachnutzbar. Die direkte Verlinkung von Publikationen mit Forschungsdaten macht Forschungsergebnisse transparent und nachvollziehbar. Forschungsdaten werden als Bestandteil wissenschaftlicher Arbeit sichtbar und können die Reputation der Forschenden stärken.

Ground Truth Daten als Forschungsdaten

Die Archivierung von Ground Truth Daten als wichtige Forschungsdaten hat sich im FID4SA aus einem Teilprojekt der vergangenen Förderphasen entwickelt. Zum Angebot des FID4SA gehört auch die Digitalisierung und Bereitstellung von Textsammlungen aus den Beständen der UB Heidelberg und der CATS Bibliothek. Im Bestand befindet sich eine ca. 2.300 Bände umfassende Sammlung mit Büchern des 1858 in der nordindischen Stadt Lakhnau gegründeten Verlagshauses Naval Kishore Press (NKP). Inhaltlich deckte das Verlagsportfolio eine große Bandbreite ab – Literatur in Regionalsprachen, Ratgeber, Religion sowie klassische Sanskrit-Literatur wurden vom Verlag publiziert. Ausgewählte Werke der NKP Sammlung werden digitalisiert und Titel in der südasiatischen Devanagari-Schrift im Anschluss mit OCR bearbeitet. Die automatisiert erkannten Texte stehen Nutzer:innen als in Originalschrift sowie lateinischer Transliteration durchsuchbarer Volltext zur Verfügung, wobei die Fundstelle des gesuchten Wortes oder der gesuchten Phrase sowohl im Bildfaksimile als auch im Volltext hervorgehoben wird. Die Webpräsentation der bearbeiteten Texte erfolgt über das FID4SA Portal.

Für den Workflow kommt die Heidelberger Eigenentwicklung DWork, als Teil von heiRIS, zum Einsatz. Die Software ist modular konzipiert und unterstützt sämtliche Einzelschritte des Digitalisierungsworkflows – von der Metadatenerstellung über die Scanverarbeitung bis zur Erstellung der Webpräsentation mit Annotations- und Kommentarfunktionen.


Abb. 3: Beispielseite eines Buches der NKP Sammlung mit Bildfaksimile und OCR Text in Devanagari-Schrift und lateinischer Transliteration

Für die Texterkennung greift der FID4SA auf KI-basierte Ansätze zurück und nutzt dafür die Plattform Transkribus.15 Verschiedene Datenmodelle für die Texterkennung wurden mit Transkribus für diesen Bestand trainiert, die mit einer Character Error Rate (CER) zwischen 2,20 und 0,83 Prozent sehr gute Ergebnisse liefern, so dass auf Nachkorrekturen der Erkennungsergebnisse inzwischen weitgehend verzichtet werden kann. Das Datenmodell Devanagari mixed M1A für die Erkennung von gedruckten Devanagari-Texten steht für Transkribus-Nutzer:innen auf der Transkribus-Webseite als öffentliches Modell zur Nachnutzung bereit.16

Um die für das Modelltraining verwendeten Bildfaksimiles und Transkriptionen (Ground Truth) einer breiten Forschenden-Community zur Verfügung zu stellen, hat der FID4SA auf dem Heidelberger Forschungsdatenrepositorium heiDATA ein Dataverse für die Veröffentlichung von Ground-Truth-Daten für südasiatische Schriften eingerichtet – FID4SA@heiDATA.17 In diesem Dataverse werden Ground-Truth-Daten veröffentlicht, die der FID4SA im Rahmen seiner Digitalisierungsprojekte erzeugt hat. Interessierte Forscher:innen können die hier archivierten Daten herunterladen und als Trainingsdaten für eigene Texterkennungsmodelle verwenden, unabhängig davon mit welcher OCR-Software Datenmodelle trainiert werden.18 Gleichzeitig sind Forschende, die an der Texterkennung für südasiatische Schriften arbeiten, eingeladen, dieses Archiv zu nutzen, um ihre eigenen Ground-Truth-Daten zur Verfügung zu stellen und zum Aufbau eines Ground-Truth-Datenarchivs für südasiatische Schriften an einer zentralen Stelle beizutragen.


Abb. 4: Ground Truth Dataset für Devanagari

Derzeit stellt das Archiv vier Datensätze für verschiedene südasiatische Schriften zur Nachnutzung bereit. Neben dem eigenen Datensatz für Devanagari drei weitere von Projektpartnern – Malayalam (UB Tübingen), Bengali (British Library) und Pracalit (Alexander O’Neill, SOAS). Alle vier Datensätze zusammen verzeichnen seit ihrer Veröffentlichung bereits 705 Downloads (Stand: Juli 2024), was den Bedarf an solchen Daten in der Fachcommunity belegt. Auch hier erhält jeder Datensatz einen DOI und wird im Verbundkatalog K10Plus nach bibliothekarischen Standards inhaltlich und formal erschlossen. Damit sind die Sichtbarkeit, Zitierbarkeit und Auffindbarkeit der Daten gewährleistet.

Bilddaten als Forschungsdaten in FID4SA_images

Den FID4SA erreichen zunehmend Anfragen von den Verantwortlichen südasienwissenschaftlicher Forschungsprojekte, die neben einem Ort zur nachhaltigen Aufbewahrung ihres Bild- und Multimediamaterials im Sinne eines Forschungsdatenrepositoriums auch eine komfortable und den FAIR-Prinzipien entsprechende Erschließungs- und Recherchedatenbank suchen. Hier ist der FID zu einem idealen Kooperationspartner für externe Projektpartner geworden und kann so dazu beitragen, den Aufbau nicht nachhaltiger Einzellösungen zu vermeiden. Die vom FID4SA zur Verfügung gestellte Objekt- und Multimediadatenbank FID4SA_images_19 ist speziell auf die Anforderungen entsprechender Datenformate zugeschnitten und bietet neben standardisierten Metadatenschemata und 3-D-Visualisierung auch die DOI-Vergabe auf Datensatzebene und das IIIF-Manifest zur Einbindung des Bildmaterials in externe Forschungsumgebungen. FID4SA_images_ dient den Kooperationspartnern für ihre spezifischen Pools nicht nur als nachhaltiges Repositorium, sondern auch als Aggregatordatenbank für die Vernetzung mit nationalen und internationalen Nachweisinstrumenten wie der Deutschen Digitalen Bibliothek (DDB) oder Europeana.

Im Kontext der FID-Förderung hat der FID4SA bei der Bereitstellung und Archivierung von Bildmaterialien unter anderem mit dem BMBF geförderten und am Center for Religious Studies (CERES) der Ruhr-Universität Bochum angesiedelten Projekt DiGA – Digitization of Gandharan Artefacts kooperiert.20 Unter der Leitung von Jessie Pons und Frederik Elwert digitalisierte das Projektteam in Zusammenarbeit mit den Museen vor Ort einen Korpus von ungefähr 1.500 buddhistischen Skulpturen aus der historischen Region Gandhara im heutigen Pakistan.


Abb. 5: Beispieldatensatz aus dem DiGA Projekt in FID4SA_images

Unter Verwendung kontrollierter Vokabularien wurden die Objekte katalogisiert und beschrieben, die Metadaten und Bilddaten in FID4SA_images_ in Open Access zugänglich gemacht. Parallel dazu haben die Forschenden einen digitalen Thesaurus zur Beschreibung buddhistischer Kunst sowie einen Gazetteer archäologischer Grabungsstätten der Gandhara-Region erstellt.21 Dieses Projekt kann in vielerlei Hinsicht als „Best-Practice“-Beispiel dienen, sei es durch die Zusammenarbeit mit lokalen Akteuren in Pakistan, die Bereitstellung im Projekt erzeugter Daten in Open Access oder die Verwendung von international etablierten Erschließungsstandards.

Forschungsdaten und die Bedarfe der Südasienforschung

Wie die aufgeführten Beispiele zeigen, unterstützt der FID Südasien seine Fachcommunity derzeit vor allem bei der Präsentation, Bereitstellung und Archivierung von Bild- und Videomaterial. Die Bildsammlungen entstehen entweder im Rahmen laufender Projekte, die von Förderinstitutionen unterstützt werden, oder gelangen als Schenkung oder Nachlass in die Bibliothek des FID Südasien am CATS. Die Übernahme dieser Bestände und ihre Bereitstellung in Open Access werfen ethische, urheberrechtliche, eigentumsrechtliche und persönlichkeitsrechtliche Fragen auf. Woher stammen die Daten? In welchen Kontexten wurden sie erhoben? Befolgen sie die CARE-Prinzipien für indigene Datensouveränität?22 Können Daten nur eingeschränkt und nicht in Open Access zugänglich gemacht werden?

Als Partner und Infrastrukturanbieter sieht es der FID Südasien als seine Aufgabe an, die Forschenden in diesem Prozess beratend zu unterstützen. Die zunehmende Digitalisierung und Bereitstellung von (Bild-)Sammlungen und Daten im Sinne von Open Science machen die Auseinandersetzung mit diesen Fragen umso dringlicher. Der FID4SA plant daher gemeinsam mit der Abteilung Kultur- und Religionsgeschichte Südasiens am SAI und der Forschungsstelle „Hinduistische Tempellegenden in Südindien“ der Heidelberger Akademie der Wissenschaften im November 2024 einen zweitägigen Workshop zum Thema „Forschungsdaten in der Südasienforschung“, um in der Diskussion mit Forschenden die spezifischen Bedürfnisse der Fachcommunity zu ermitteln.

Die genannten forschungsethischen und rechtlichen Fragen müssen auch bei der Erschließung und Beschreibung von Daten gestellt werden. Normdaten und kontrollierte Vokabulare sind keine neutralen Erschließungsinstrumente, sondern historisch geprägt und in politische Diskurse eingebettet.23 Der FID4SA kann in den Themenfeldern Normdaten und Wissensorganisation seine Expertise und Erfahrung bei der Entwicklung von Standards einbringen, wenn es z.B. um unterschiedliche Schriftsysteme und Mehrsprachigkeit geht.

FID4SA und NFDI-Konsortien

Die UB Heidelberg ist im Konsortium NFDI4Culture Mitantragstellerin und in der ersten Projektphase verantwortlich für die Task Area 4 „Data publication and availability“ sowie teilnehmende Institution im Konsortium NFDI4Objects. Da diese Aktivitäten in den Kontext aller von ihr betreuten FID eingebettet sind, werden auch für den FID4SA Synergien erzeugt. Das breite Fächercluster aus sowohl historisch als auch philologisch arbeitenden Disziplinen, das der FID4SA als regionaler FID bedient, ergibt Anknüpfungspunkte auch zu anderen NFDI-Konsortien. So ist für die FID-Förderperiode 2025-2027 im Falle der Bewilligung eine Zusammenarbeit mit dem Text+-Konsortium geplant. Ziel ist es, zur Erhöhung der Konnektivität die mit Transkribus erstellten OCR-Dateien von Texten in südasiatischen Schriften über einen FSC-Endpoint für die föderierte Text+-Suche zur Verfügung zu stellen.
Die Diskussionen während des von NFDI4Memory organisierten Workshops im Frühjahr 2024 haben gezeigt, dass die Ziele von NFDI4Memory24 fachlich sehr gut zu den historisch arbeitenden Disziplinen innerhalb der FID4SA-Fachcommunity passen. Der FID Südasien kann sich mit seiner Expertise im Bereich Normdaten und Metadaten als Vermittler an der Schnittstelle zwischen Wissenschaft und NFDI in die Diskussionen und die konkrete Projektarbeit einbringen. Aufgrund der Sprachen- und Schriftenvielfalt in der Region Südasien bringt der FID4SA wertvolle Erfahrungen mit, wenn es darum geht, Metadaten in mehreren Sprachen und Schriften gleichermaßen recherchierbar zu machen. Schließlich existiert umfangreiches Wissen über die Bereitstellung digitaler Inhalte sowie die Publikation in Open Access. Die Arbeitsschwerpunkte der „Digital Area Histories“25 innerhalb der Task Area 4 „Data Literacy“ der NFDI4Memory adressieren Fragen, die für Forschende in den südasienbezogenen Wissenschaften zentral sind. Neben dem Umgang mit Daten aus verschiedenen Weltregionen stehen auch die unterschiedlichen rechtlichen Rahmenbedingungen und der Umgang mit dem kolonialhistorischen Erbe im Fokus.

Der Workshop im Frühjahr 2024 kann der Auftakt zu einer intensiveren Zusammenarbeit zwischen NFDI4Memory, Forschenden der südasienbezogenen Regionalstudien und dem FID Südasien sein, um die begonnenen Diskussionen im gegenseitigen Austausch fortzusetzen.

Anmerkungen:
1 Bis 2004 wurde das ehemalige Sondersammelgebiet (SSG) Südasien von der UB Tübingen betreut. Seit 2005 wird es von der UB Heidelberg und dem Südasien-Institut fortgeführt. Im Zuge der Überführung in die FID Förderlinie kooperierten beide Einrichtungen von 2016 bis 2021 mit der Staatsbibliothek zu Berlin, Preußischer Kulturbesitz im FID Asien, in dem sie den Schwerpunkt Südasien verantworteten.
2 Als regional ausgerichteter Fachinformationsdienst richtet sich der FID4SA mit seinen Angeboten an Forschende in den Disziplinen der Indologie und Südasienstudien ebenso wie an Forschende angrenzender Disziplinen, deren Forschungsschwerpunkt einen Bezug zu Südasien aufweist. Zur Entwicklung des Faches siehe Carmen Brandt / Kirsten Hackenbroch, Die deutsche Südasienforschung im Wandel der Zeit, in: ASIEN 144 (Juli 2017), S. 36-57, <https://doi.org/10.11588/asien.2017.144.14772>.
3 <https://hasp.ub.uni-heidelberg.de/> und <https://fid4sa-repository.ub.uni-heidelberg.de/> (05.01.2025).
4 RfII – Rat für Informationsinfrastrukturen, „Begriffsklärungen“, in: RfII Berichte No. 1, Göttingen 2016, S. 11, <urn:nbn:de:101:1-201607146410> (05.01.2025).
5 Neben allgemeinen Empfehlungen zum Forschungsdatenmanagement gibt es eine fachspezifische Handreichung des Fachkollegiums 106 „Sozial- und Kulturanthropologie, Außereuropäische Kulturen, Judaistik und Religionswissenschaft“ der DFG, <https://www.dfg.de/de/grundlagen-themen/grundlagen-und-prinzipien-der-foerderung/forschungsdaten/empfehlungen> (05.01.2025).
6 FAIR = Findable, Accessible, Interoperable, Reusable.
7 Das sind Propylaeum – FID Altertumswissenschaften (<https://www.propylaeum.de/>), kooperativ betreut mit der Bayerischen Staatsbibliothek München und <arthistoricum.net> – FID Kunst, Fotografie, Design (<https://www.arthistoricum.net/>), kooperativ betreut mit der Sächsischen Landesbibliothek, Staats- und Universitätsbibliothek Dresden, (05.01.2025).
8 <https://www.ub.uni-heidelberg.de/de/service/open-access/publizieren/heiris> (05.01.2025).
9 <https://www.urz.uni-heidelberg.de/de/service-katalog/speicher/heiarchive> (05.01.2025).
10 Zum Einsatz kommen dabei die Open-Source-Software Open Monograph Press (OMP) und Open Journals System (OJS) des Public Knowledge Project (PKP), <https://pkp.sfu.ca/> (05.01.2025).
11 <https://heiup.uni-heidelberg.de/> (05.01.2025).
12 Im Jahr 2016 als CrossAsia-E-Publishing etabliert, wurde das Angebot im Jahr 2022 nach Beendigung der Kooperation mit der SBB Berlin beim FID Asien in Heidelberg Asian Studies Publishing umbenannt.
13 <https://heidata.uni-heidelberg.de/dataverse/hasp> (05.01.2025).
14 <https://iiif.io/> (05.01.2025).
15 <https://readcoop.eu/de/transkribus/> (05.01.2025).
16 <https://readcoop.eu/model/devanagari-mixed-m1a/> (05.01.2025).
17 <https://heidata.uni-heidelberg.de/dataverse/FID4SA-GT> (05.01.2025).
18 An der UB Heidelberg kommt bei der Texterkennung von Handschriften derzeit eScriptorium zum Einsatz. Die Trainingsdaten für südasiatische Schriften können also auch für das Modelltraining mit der vorhandenen Infrastruktur von eScriptorium nachgenutzt werden.
19 FID4SA_images_ wird als Teilbestand von heidICON aktuell mit der Software easyDB 5.0 der Firma programmfabrik betrieben. Die in Heidelberg entwickelten Programme/Schnittstellen nutzen die API oder die OAI-PMH von easyDB und stehen Open Source zur Nachnutzung bereit. Das Datenmodell basiert auf dem XML-Harvesting-Schema LIDO (Lightweight Information Describing Objects) und mit der Einbindung von normiertem Vokabular werden zentrale Linked Open Data-Prinzipien erfüllt, <https://www.fid4sa.de/ressourcen/digitale-bildsammlungen> (05.01.2025).
20 <https://ceres.rub.de/en/research/projects/diga-project/> (05.01.2025).
21 Ausführlich zum Projektkonzept: Frederik Elwert und Jessie Pons: Brücken bauen für Buddha – Das Projekt „Digitalisierung Gandharischer Artefakte (DiGA)“ und die Pelagios Working Group „Linked Open Data Methodologies in Gandharan Buddhist Art and Texts“. DHd 2022 Kulturen des digitalen Gedächtnisses. 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" (DHd 2022), Potsdam, Zenodo, <https://doi.org/10.5281/zenodo.6322468>.
22 Ich danke Dr. Simon Cubelic für den Hinweis auf den Aspekt der indigenen Datensouveränität. Siehe dazu: Sabine Imeri / Michaela Rizzolli, CARE Principles for Indigenous Data Governance. Eine Leitlinie für ethische Fragen im Umgang mit Forschungsdaten, in: O-bib – Das offene Bibliotheksjournal 9 (2) (2022), S. 1-14, <https://doi.org/10.5282/o-bib/5815>.
23 Zur Rolle der Bibliotheken beim Umgang mit Forschungsdaten indigenen Ursprungs aus kolonialen Kontexten, siehe Sabine Imeri / Moritz Strickert / Julia Zenker: Koloniale Kontexte in der Bibliothek. Vernetzen, Erschließen, Bereitstellen, in: Bibliothek – Forschung und Praxis 48 (2) (2024), S. 302-310, <https://doi.org/10.1515/bfp-2023-0036>.
24 Silvia Daniel / Gregor Horstkemper / Arnošt Štanzel, NFDI4Memory: Der Beitrag der Bayerischen Staatsbibliothek, in: Zeitschrift für Bibliothekswesen und Bibliographie 71 (2) (2024), S. 61-69, <https://doi.org/10.3196/186429502471217>.
25 Digital Area Histories in der NFDI4Memory, <https://recentglobe.uni-leipzig.de/en/forschung/forschungsprojekte/nfdi4memory-digital-area-histories> (05.01.2025).

Editors Information
Published on
17.01.2025
Cooperation
Dieser Beitrag enstand im Rahmen des Fachforums 'Connections'. http://www.connections.clio-online.net/
Classification
Temporal Classification
Regional Classification
Additional Informations
Language