Das Team der Task Area “Data Quality” des Konsortiums NFDI4Memory befragte Forschende und Infrastrukturmitarbeitende in historisch arbeitenden Fächern im Rahmen einer Online-Umfrage zu Praktiken, Standards und Bedarfen in Bezug auf Datenqualität (Laufzeit des Fragebogens: 7.08.–18.11.2024). Ziel der Umfrage war es, herauszufinden, welche Standards die Community verwendet, wie die Qualität von Forschungsdaten gewährleistet wird und welche Bedarfe die Community im Bereich Datenqualitätsmanagement sieht.
Die Umfrage bietet detaillierte Einblicke in die tägliche Arbeitswelt der historisch-forschenden Community. Im Folgenden listen wir einige Beobachtungen aus der Umfrage auf. Den vollständigen Bericht finden Sie hier:
Pravdyuk, A., Körfer, A.-L., Große, P., Greb, H., Grevelhörster, D., & Meiners, O. (2025). Bericht zur Umfrage “Praktiken, Standards und Bedarfe zur Datenqualität in den Communities der historisch arbeitenden Fächer”. In 4memory Working Paper Series (1-0, Number 7). Zenodo. https://doi.org/10.5281/zenodo.17434287
Bedarf an der Verbesserung von Datenqualität
In Bezug auf das zentrale Thema der Umfrage – ob es in der Community ein Bewusstsein für Fragen von Datenqualität gibt – wird deutlich, dass in der Gruppe der Forschenden ein allgemeines Bewusstsein für dieses Thema vorhanden ist (44 % begegnen oft Fragen zur Datenqualität). Zugleich ist in dieser Gruppe der Anteil an Personen, die bei dieser Frage das Item “Ich kann diese Frage nicht beantworten” ausgewählt haben, mit 19 % relativ hoch (Q12; “n = ” gibt die Gesamtzahl der Personen an, die eine Frage beantwortet haben).
Q12. Wie häufig begegnen Ihnen in Ihrem Arbeitsalltag Fragen zur Datenqualität? (Single Choice)*
Forschende (Ergebnisse für Gruppe A)

n = 59
Die befragten Infrastrukturmitarbeitenden sind in ihrem Arbeitsalltag häufiger mit Fragen der Datenqualität konfrontiert. 68 % geben an, dass sie oft, und 24 %, dass sie manchmal damit konfrontiert sind.
Infrastrukturmitarbeitende (Ergebnisse für Gruppe B)

n = 86
Insgesamt scheinen die befragten Infrastrukturmitarbeitenden in ihrem Arbeitsalltag häufiger mit Fragen der Datenqualität zu tun zu haben als die befragten Forschenden. Der Vergleich zwischen beiden Gruppen ist dabei weniger relevant als die Beobachtung, dass die Community der Forschenden innerhalb der Umfrage einen erhöhten Informationsbedarf bezüglich Fragen der Datenqualität zu haben scheint. Was genau bedeutet Datenqualität, warum ist sie wichtig und wie können Forschende sie gewährleisten?
Verfahren zur Erkennung von Datenqualitätsmängeln
Die FAIR-Prinzipien sind für Forschende und Infrastrukturmitarbeitende in GLAM-Einrichtungen gleichermaßen zentral. Forschende sind auf gut auffindbare, zugängliche und interoperable Daten angewiesen, um valide, anschlussfähige Forschung zu betreiben. Infrastrukturmitarbeitende nutzen die Prinzipien, um Daten nachhaltig zu pflegen, standardisiert bereitzustellen und in übergreifende Systeme einzubinden. Die FAIR-Prinzipien schaffen damit eine gemeinsame Grundlage, auf der wissenschaftliche (Nach-)Nutzung von Forschungsdaten und technische Datenpflege ineinandergreifen.
Der überwiegende Teil der Infrastrukturmitarbeitenden gibt an, bei der Datenerstellung, -bearbeitung oder -auswertung Verfahren zur Erkennung von Datenqualitätsmängeln zu verwenden (73 %).
Q14. Wenden Sie bei der Datenerstellung, -bearbeitung oder -auswertung Verfahren an, um Mängel im Bereich der Datenqualität zu erkennen? (Single Choice)*
Infrastrukturmitarbeitende (Ergebnisse für Gruppe B)

n = 86
Bei den Forschenden wenden 39 % der Befragten Verfahren zur Identifizierung von Qualitätsmängeln an. 36 % der befragten Forschenden geben an, keine Verfahren zur Erkennung von Datenqualitätsmängeln zu verwenden. 22 % der Personen können die Frage nicht beantworten (Q14).
Forschende (Ergebnisse für Gruppe A)

n = 59
Bereitstellung von Daten zur Einsicht oder Nachnutzung
Im Hinblick auf die Bereitstellung von Daten zur Nachnutzung zeigt sich, dass 94% der Infrastrukturmitarbeitenden Daten vollständig oder zumindest teilweise zur Nachnutzung zur Verfügung stellen. Bei den Forschenden liegt dieser Anteil bei 78 % (Q20, Q21).
Bemerkenswert ist, dass über die Hälfte der Infrastrukturmitarbeitenden Forschungsdaten (65) und etwa die Hälfte Metadaten (40) nur auf Anfrage bereitstellen. Dieses Ergebnis lässt sich möglicherweise dadurch erklären, dass unter den Infrastrukturmitarbeitenden ein hoher Anteil an Archivar*innen vertreten ist, die entweder sensible Quellenbestände verwahren oder über Materialien verfügen, die noch nicht vollständig digitalisiert vorliegen (Q25).
Infrastrukturmitarbeitende (Ergebnisse für Gruppe B)

n = 81
Bedarfe in der Community: Hilfsmittel zur Verbesserung der Datenqualität
Die Infrastrukturmitarbeitenden nennen folgende Hilfsmittel, die für die Verbesserung von Datenqualität in historisch arbeitenden Fächern hilfreich wären:
- die Aufstockung personeller Ressourcen im Bereich Forschungsdatenmanagement (FDM)
- der interdisziplinäre Austausch, die fachliche Ausbildung sowie die Entwicklung (insbesondere quelloffener) Softwarelösungen und Schnittstellen
- der Wunsch nach einer stärkeren Standardisierung
- ausführliche Dokumentation von Verfahren und Datenbanken
- praxisnahe Handreichungen zur Anwendung von Metadatenstandards
Für Forschende sind folgende Verbesserungen wünschenswert:
- Ausbau der technischen Infrastruktur – insbesondere von besserer Hardware wie Scanner oder spezialisierter Software etwa für die Texterkennung (OCR)
- zusätzlicher Personalbedarf etwa für Aufgaben im FDM
- Bedarf an Schulungen, Leitfäden und Richtlinien zu unterschiedlichen Aspekten der Datenqualität
Ausblick
Die Umfrage “Praktiken, Standards und Bedarfe zur Datenqualität in den Communities der historisch arbeitenden Fächer” bietet einen facettenreichen Überblick über die in den Communities historisch arbeitender Fächer geübten Praktiken im Umgang mit Forschungsdaten, die verwendeten Daten- und Metadatenstandards sowie entsprechende Bedarfe. Die gewonnenen Erkenntnisse werden in das “Data Quality Framework” und weitere Guidelines der Task Area “Data Quality” einfließen.
Die Umfrage hat wesentlich dazu beigetragen, ein differenzierteres Verständnis über den aktuellen Stand der in den historisch arbeitenden Fachdisziplinen verbreiteten Vorstellungen von Datenqualität sowie über die angewandten Praktiken und bestehende Bedarfe zu gewinnen. Dabei wurde deutlich, dass innerhalb der Community ein starkes Interesse an zielgruppenspezifischen Unterstützungsangeboten zum Thema Datenqualität besteht. Genannt wurden insbesondere praxisorientierte Anleitungen und Hilfestellungen zu unterschiedlichen Aspekten wie dem Umgang mit Lizenzen, der Anwendung von (Meta-)Datenstandards oder der Auseinandersetzung mit ethischen Fragestellungen.
Der vollständige Bericht und das dazugehörige Datenset wurden auf Zenodo veröffentlicht:
Pravdyuk, A., Körfer, A.-L., Große, P., Greb, H., Grevelhörster, D., & Meiners, O. (2025). Bericht zur Umfrage “Praktiken, Standards und Bedarfe zur Datenqualität in den Communities der historisch arbeitenden Fächer”. In 4memory Working Paper Series (1-0, Number 7). Zenodo. https://doi.org/10.5281/zenodo.17434287
Pravdyuk, A., & Grevelhörster, D. (2025). Export der Ergebnisse zur Online-Umfrage “Praktiken, Standards und Bedarfe zur Datenqualität in den Communities der historisch arbeitenden Fächer” der Task Area “Data Quality” im Konsortium “NFDI4Memory” der Nationalen Forschungsdateninfrastruktur (1-0) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.17734726
Wir schlagen Ihnen vor, diesen Beitrag wie folgt zu zitieren: Assessment Praktiken, Standards und Bedarfe zur Datenqualität, bearbeitet von Anna Pravdyuk (2026, März). Veröffentlichungen zur Datenqualität in den historischen Wissenschaften. https://datenqualitaet.org/ressourcen/assessment-datenqualitaet/