RfII | Rat für Informationsinfrastrukturen

Themen

Der RfII hat für die Pilotphase das Schwerpunktthema „Forschungsdaten – Nachhaltigkeit – Internationalität“ gewählt. Als Ergebnis seiner Arbeit sind eine Reihe von Ressourcen und Empfehlungen entstanden, die das Thema in verschiedenen Facetten ausleuchten.

Forschungsdatenmanagement

Der Prozess der Digitalisierung in der Wissenschaft betrifft u.a. Forschungsmethoden und Forschungsdaten, Digitalität verändert die Möglichkeiten wissenschaftlichen Erkenntnisgewinns grundlegend. Aus Sicht des RfII ist der Umgang mit Forschungsdaten in Deutschland trotz einiger guter Beispiele bislang noch durch überwiegend schwach koordinierte, projektförmige Initiativen geprägt. Eine Grundversorgung der Forschenden mit niedrigschwelligen Services für das Forschungsdatenmanagement fehlt, und es besteht Handlungsbedarf in etlichen Feldern.

Der RfII hat daher sein erstes großes Positionspapier LEISTUNG AUS VIELFALT (2016) dem Thema Forschungsdatenmanagement gewidmet. Das Positionspapier strukturiert die vielschichtige Materie, bietet eine detaillierte, auch deutlich formulierte Diagnostik. Die Spanne der Empfehlungen reicht von kurzfristig wirksamen Anpassungen (z. B. der Evaluation von Drittmittelanträgen) bis zu strategischen langfristig wirksamen Gestaltungsaufgaben (z. B. Verstetigungsoptionen für projektförmig finanzierte Dienste und den Aufbau einer Nationalen Forschungsdateninfrastruktur). Im Anhang sind Klärungen wichtiger Schlüsselbegriffe und eine Aufarbeitung des forschungspolitischen Strategiediskurses veröffentlicht, die jeweils auch als Arbeitspapiere verfügbar sind.

Der FACHBERICHT LÄNDERANALYSEN (2017) stellt parallele Entwicklungen und Pfadentscheidungen in Kanada, Großbritannien, den Niederlanden und Australien dar. Aus diesen Fallbeispielen leitet der RfII eine Reihe von Anregungen ab, die z. B. für den empfohlenen Aufbau einer Nationalen Forschungsdateninfrastruktur (NFDI) hilfreich sind.

Empfehlungen des RfII

rfii_Cover

Leistung aus Vielfalt. Empfehlungen zu Strukturen, Prozessen und Finanzierung des Forschungsdatenmanagements in Deutschland, Göttingen 2016, 160 S.

rfii_Cover

Entwicklung von Forschungsdateninfrastrukturen im internationalen Vergleich. Bericht und Anregungen, Göttingen 2017, 93 S.

Nationale Forschungsdateninfrastruktur (NFDI)

Eine zentrale Empfehlung des RfII lautet, eine koordinierte Forschungsdateninfrastruktur für Deutschland (NFDI) aufzubauen. Der RfII schlägt vor, mit diesem neuartigen Konstrukt einen langfristigen Entwicklungspfad einzuschlagen. Die gegenwärtig schwach koordinierte und nicht nachhaltig förderbare Landschaft der Dateninfrastrukturen in der Wissenschaft wird so in eine effizientere und kooperativere Richtung gelenkt. Eine Systematisierung der Datenbestände, gute Zugänglichkeit der Forschungsdaten und kontinuierliche Weiterentwicklung der Dienste stärken die Forschung in Deutschland und ihre globale Wettbewerbsposition.

Die NFDI ist als ein arbeitsteilig angelegtes, bundesweites und in Stufen aufzubauendes Netzwerk konzipiert. Sie soll ein verlässliches und nachhaltiges Dienste-Portfolio bereitstellen, welches generische und fachspezifische Bedarfe des Forschungsdatenmanagements in Deutschland abdeckt. Die NFDI entsteht stufenweise und wissenschaftsgetrieben. Ihre Dienste stehen Forschenden fach-, institutionen- sowie bundesländerübergreifend zur Verfügung.

Die Etablierung der NFDI ist im RfII-Positionspapier LEISTUNG AUS VIELFALT (2016) vorgeschlagen worden. Ergänzend hat der RfII zwei an die Wissenschaftsöffentlichkeit gerichtete Diskussionspapiere veröffentlicht. Die nachstehende Auswahl an Resonanzen zeigt, wie Akteure im Wissenschaftssystem die Vorschläge zur Errichtung einer Nationalen Forschungsdateninfrastruktur reflektieren.

Resonanz im Wissenschaftssystem

Diskussionsimpulse des RfII

Cover-Icon

Schritt für Schritt – Diskussionsimpuls zu Zielstellung und Voraussetzungen für den Einstieg in die Nationale Forschungsdateninfrastruktur (NFDI), Göttingen, 2017, 4 S.

Cover-Icon

Zusammenarbeit als Chance – zweiter Diskussionsimpuls zur Ausgestaltung einer Nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland, Göttingen, 2018., 4 S.

Datenschutz

Digitale Daten werden in allen Lebensbereichen und besonders in der Wissenschaft zunehmend und durch neue Analysemethoden auch umfassender genutzt. Soweit es sich um personenbezogene Daten handelt, aber auch darüber hinaus, geraten Datenschutzbelange und das Recht auf Forschungsfreiheit vermehrt in Konflikt. Die für den wissenschaftlichen Erkenntnisgewinn notwendige Nachnutzung und Verknüpfung von (auch personenbezogenen) Daten findet etwa an der jeweiligen Zweckbindung der Datensätze enge Grenzen.

Der RfII hat im März 2017 mit seinem Papier DATENSCHUTZ UND FORSCHUNGSDATEN erste Anregungen zur Vereinbarkeit von guter Forschung und gutem Datenschutz gegeben. Die Empfehlungen des RfII beziehen sich auf vier Handlungsfelder:

  • Zukunftsorientiertes Datenschutzrecht – v. a. Umgang mit dem Spannungsfeld zwischen dem Grundrecht auf informationelle Selbstbestimmung und dem Grundrecht der Forschungsfreiheit
  • „Weiche“ Normierungsformen – Verbesserung des Datenschutzes durch Normsetzung und Gremienwesen im Rahmen wissenschaftlicher Selbstorganisation
  • Kompetenzentwicklung – für datenschutzkonformes Handeln bei allen Akteuren, die an der Generierung und Nutzung von Forschungsdaten beteiligt sind
  • Dateninfrastrukturen – für eine datenschutzkonforme Datenverarbeitung, regulierte Zugangswege zu Forschungsdaten und somit harmonisierte Datenschutzstandards

Hintergrund für die Veröffentlichung des RfII ist die Umsetzung der europäischen Datenschutzgrundverordnung (DS-GVO) aus dem Jahr 2016) gewesen. Die RfII-Empfehlungen sind als Impulse zu verstehen, die wissenschaftliche Nutzung personenbezogener Daten mit Augenmaß zu erleichtern. Sie greifen weitergehenden Reformen nicht vor. Solche hält der RfII allerdings im Interesse der Wissenschaft für notwendig.

Cover-Icon

Datenschutz und Forschungsdaten. Aktuelle Empfehlungen, Göttingen 2017, 34 S.

Schlüsselbegriffe

Die Teilprobleme im Themengebiet des RfII sind oft komplex und voraussetzungsreich. Daher nimmt der RfII in Abständen Klärungen wichtiger Begriffe und ihrer Übertragbarkeit ins Englische vor. Die Verwendung einer einsichtigen und einheitlichen Terminologie ist unverzichtbar für einen informierten Diskurs.

[data quality]

Diese Begriffsklärung wurde 2017 in überarbeiteter Fassung vom RfII verabschiedet

Der Begriff Datenqualität bezeichnet sowohl allgemeine, u. a. unter Methodengesichtspunkten geforderte, typische Eigenschaften der Daten selbst als auch deren durch qualitätssichernde Maßnahmen ggf. zusätzlich geschaffene Eignung für eine weitere Nutzung. Die Bewertung von Datenqualität richtet sich zum einen nach den abhängig von der jeweiligen Forschungsfrage und damit von der Verwendung zur Erarbeitung eines Forschungsergebnisses zu definierenden Ansprüchen an die Daten. Diese umfassen etwa die Genauigkeit von Messwerten, die Zuverlässigkeit eines empirisch gewonnenen Ergebnisses, die Vollständigkeit oder Aktualität von Daten und die Dokumentation der Datengewinnung und der Datenspeicherung. Darüber hinaus sind aber auch Nachhaltigkeitsgesichtspunkte von der Bewertung der spezifischen Qualität von Daten nicht zu trennen. Solche Gesichtspunkte umfassen die Datenbeschaffenheit, etwa die Transferierbarkeit der Daten, die Haltbarkeit von Datenträgern etc. Sie betreffen insbesondere die vorausschauende Haltung von Forschungsdaten für spätere, idealerweise viele und ggf. auch noch unbekannte, Formen der wissenschaftlichen, wirtschaftlichen und gesellschaftlichen Nutzung. Unter dem Gesichtspunkt einer weiteren Nutzung („Nachnutzung“) wird Datenqualität dadurch bestimmt, dass Datensätze und -sammlungen leicht zu recherchieren/findbar sind, sowie dass sie ausreichend Zusatzinformationen beinhalten. Diese sollten in Form von möglichst standardisierten technischen und fachlichen Metadaten zu Qualitätsaspekten vorliegen und Auskunft über die Datengenerierung, Weiterverarbeitung und die verwendeten Instrumente und Methoden geben. Voraussetzung für die Nachvollziehbarkeit und wenn möglich Nachnutzung von digitalen Forschungsergebnissen ist, dass die enthaltenen Daten bezüglich der ihnen zugrundeliegenden Datenmodelle (verwendete Vokabulare, Formate, etc.) und der verwendeten Methoden (etwa Messgeräte, Befragungen, Algorithmen etc.) umfassend dokumentiert sind. Wo immer möglich, sollten nicht nur Metadaten, sondern auch weitergehende, ggf. spezielle Dokumentationen, anerkannten, verfügbaren Standards folgen. Die – auch langfristige – Verfügbarkeit, Zugänglichkeit und Zitierbarkeit von Forschungsdaten einschließlich ihrer Metadaten sind wiederum Aspekte der Qualität von Informationsinfrastrukturen und -services, welche die sichere Speicherung, das zielgenaue Auffinden (Retrieval), den Zugriff auf die Daten und ihre Nachnutzung (auch im Kontext der Langzeitarchivierung) ermöglichen. Die Klärung von rechtlichen Rahmenbedingungen einer möglichen Datennutzung gehört, im Zusammenhang mit informationsinfrastrukturellen Diensten, ebenfalls zur Datenqualität.

RfII (2017) – Arbeitsthema Datenqualität (unveröffentlicht), S. 11

[information infrastructures (RfII), e-infrastructures (EU)]

Informationsinfrastrukturen sind technisch und organisatorisch vernetzte Dienste und Angebote für den Zugang zu und die Erhaltung von Daten-, Informations- und Wissensbeständen. Im Sinne des RfII dienen sie primär Forschungszwecken, sie sind häufig Forschungsgegenstand und haben stets eine ermöglichende Funktion.

Informationsinfrastrukturen müssen berücksichtigen, dass Wissensbestände in Universitäten, Forschungseinrichtungen, Archiven, Bibliotheken und Museen in analogen, digitalen oder in Mischformen vorliegen. Die digitale Erschließung analoger Wissensbestände zielt auf die Integration und Konvergenz zwischen digitalisierten und nativ digitalen Daten in einheitlichen, integrierten Arbeitsumgebungen mit dem Ziel dynamischer Wissensintegration. Wie der englische Ausdruck ‚e-Infrastructures‘ referenziert deshalb auch der deutsche Begriff ‚Informationsinfrastrukturen‘ zunehmend auf digitale Informations- und Kommunikationstechnologien für die Forschung.

Die Leistungsfähigkeit von digitalen Informationsinfrastrukturen hängt maßgeblich von den Investitionen für die Erschließung der Inhalte, nutzungsfreundlichen Zugangsformen, technischer Ausstattung, internationalen Standards und effektiven Werkzeugen ab. Ebenso relevant ist die informationsfachliche Kompetenz von Nutzern und Personal und – damit zusammenhängend – die Qualität passgenauer Dienstleistungen.

[research data, research data management]

Diese Begriffsklärung wurde 2017 in überarbeiteter Fassung vom RfII verabschiedet

FORSCHUNGSDATEN sind nicht allein die (End-)Ergebnisse von Forschung. Es handelt sich vielmehr um jegliche Daten, die im Zuge wissenschaftlichen Arbeitens entstehen, z. B. durch Beobachtungen, Experimente, Simulationsrechnungen, Erhebungen, Befragungen, Quellenforschungen, Aufzeichnungen, Digitalisierung, Auswertungen. Zu Forschungsdaten werden auch solche, nicht selbst gewonnenen Daten, auf die die Wissenschaft zu Forschungszwecken zugreift, um sie für den konkreten Forschungsprozess als methodisch erforderliche Grundlage zu nutzen. Dies ist z.B. gegeben, wenn amtliche Statistiken oder andere Behördendaten oder Produkte nichtwissenschaftlicher Dienstleister wissenschaftlich verarbeitet werden. Dass auch die verwendeten Forschungswerkzeuge sowie die mitlaufend entstehenden Spuren wissenschaftlicher Arbeit – also Prozessdaten, wie sie namentlich die digitale Forschung vielfach automatisch hervorbringt – zu den Forschungsdaten zählen, ist überall dort von Bedeutung, wo die Dokumentation und Archivierung von Forschungsprozessen und Forschungsdaten zu deren Qualitätssicherung gehört oder aber unter Nachhaltigkeitsgesichtspunkten sowie für die historische Forschung geboten ist.

Pragmatisch, wenn auch nicht immer trennscharf, lassen sich Forschungsdaten von METADATEN unterscheiden. Metadaten dokumentieren und kontextualisieren den Entstehungsprozess von Forschungsdaten. Im Forschungsprozess können Metadaten selbst wieder Gegenstand von Forschung werden, was u.a. für den Lebenszyklus von Forschungsdaten von Bedeutung ist.

Das FORSCHUNGSDATENMANAGEMENT umfasst alle – über das Forscherhandeln im engeren Sinne hinaus auch organisationsbezogenen – Maßnahmen, die getroffen werden müssen, um qualitätsvolle Daten zu gewinnen, um die gute wissenschaftliche Praxis im Datenlebenszyklus einzuhalten, um Ergebnisse reproduzierbar zu machen und um ggf. bestehenden Dokumentationsverpflichtungen Rechnung zu tragen (z.B. im Gesundheitswesen). Auch ist die (ggf. domänenübergreifende) Verfügbarkeit von Daten zur Nachnutzung ein wichtiger Punkt. Zunehmend finden Datenmanagementpläne in wissenschaftlichen Institutionen Anwendung. Datenmanagementpläne, die zu Anfang eines Projekts entwickelt und niedergelegt werden oder das Ergebnis einer Forschungsarbeit sind, sollen die zu nutzen-den und zu generierenden Daten und die notwendigen Dokumentationen, Metadaten und Standards beschreiben, mögliche rechtliche Einschränkungen (z. B. Datenschutz) rechtzeitig benennen, benötigte Speicherressourcen einplanen sowie Kriterien festlegen, welche Daten Externen in welcher Form verfügbar gemacht werden und wie die Daten langfristig zu sichern sind. Auf der Organisationsebene müssen forschende Einrichtungen (z. B. Hochschulen) den Zugang zu entsprechenden Infrastrukturdiensten innerhalb der Einrichtung (z. B. durch Auf- und Ausbau passender Kapazitäten) oder in Zusammenarbeit mit externen Partnern (durch Kooperationsverträge etc.) ermöglichen. Dabei sollte aktiv auch auf das übergeordnete Ziel einer domänenübergreifenden, wissenschaftsweiten Datennutzung hingearbeitet werden.

Arbeitspapiere des RfII

arbeitspapiere

Begriffsklärungen: Bericht des Redaktionsausschusses Begriffe an den RfII (RfII Berichte No. 1), Göttingen 2016, 31 S.