HEFE – Heterogene Forschungsdaten im Stadtkontext: Governance für Analyse-, Planungs- und Echtzeitdaten

Alle Aktivitäten von Forschenden vom Projektantrag bis hin zur Publikation finaler Forschungsergebnisse gehen einher mit dem Management strukturierter Daten. In Zeiten von Digitalisierung und Open Science ergeben sich auch an Forschungsdaten immer höher Anforderungen. So ergeben sich Methodikdokumentation und Standardkonformität aus dem Transparenzanspruch von Open Science einerseits und notwendiger Interoperabilität sensibler und geheimer Daten andererseits. Das Fraunhofer IAO und das Fraunhofer IRB haben im Auftrag des Bundesministeriums für Bildung und Forschung BMBF im Rahmen des Projektes »HEFE – Heterogene Forschungsdaten im Stadtkontext: Governance für Analyse-, Planungs- und Echtzeitdaten« – eine Data Governance speziell für heterogene Forschungsdaten an interdisziplinären Forschungsorganisationen entwickelt und erprobt.

Eine besondere Rolle spielten dabei die Domänen Qualitative Leitfadengespräche, Quantitative Befragungen sowie Bauwerksgeodaten und Mobilitätsgeodaten. Speziell für diese Domänen wurden Methodikchecklisten erarbeitet, die ebenso detaillierte Vorlagen und Strukturen für die Datenablage liefern. Darüber hinaus sind Arbeitshilfen zur Datendokumentation für alle Forschungsdaten entstanden, die kompatibel zu Fraunhofer FORDATIS und damit den Metadatenstandards DataCite und Dublincore sind.

Aufbauorganisation

Das Data Governance-Gremium steuert das Data-Governance-Team (HEFE-Team), das übergreifende Rahmenbedingungen für das Forschungsdatenmanagement zu Prozess und Metadatenstruktur schafft und diskutiert. Die nebenstehende Abbildung veranschaulicht die drei Organisationsebenen (Entscheidungsinstanz, Data Governance und Management) mit den entsprechenden Rollenverteilungen.

Wie in der Abbildung angedeutet, sind die Domänenwissenschaftlerinnen und -wissenschaftler zwar hauptsächlich am Fraunhofer IAO beheimatet, aber nicht darauf beschränkt (bspw. Beteiligung der Fraunhofer ZV, des IRB oder der Universität Stuttgart denkbar). Insgesamt gibt es folgende Rollen der Aufbauorganisation:

Die Wissenschaftlerinnen und Wissenschaftler forschen und nutzen dabei angebotene Services (Metadaten-Vorlagen, Checklisten, Leitfäden) und Beratungsstellen für weitere Unterstützung

Die Datenkuratoren/Bibliotheksmitarbeitende führen die Qualitätskontrolle durch, indem sie Daten nach generellen und domänenspezifischen Metadatenregeln prüfen. Sie stellen außerdem Einverständniserklärungen für die Durchführung von Umfragen zur Verfügung, erstellen Verknüpfungen zu ähnlichen Projekten und managen die Parallel- bzw. Nachnutzungsrechte der Daten.

Die Domänen-Verantwortlichen/Beratenden sind Wissenschaftlerinnen und Wissenschaftler mit Fachexpertise. Sie stehen an der Spitze der verschiedenen domänenspezifischen Arbeitsgruppen und bieten anderen Wissenschaftlerinnen und Wissenschaftlern Beratungsservices. Sie sorgen außerdem für die einheitliche Datenablage in jeder Domäne und verantworten die domänenspezifischen Teile des Regelwerks. Außerdem geben sie einfache domänenspezifische Checklisten und Vorlagen für die Nutzung heraus.

Das Data Governance Team/HEFE-Projektteam sind Wissenschaftlerinnen und Wissenschaftler des Projekts HEFE. Sie treiben das Forschungsdatenmanagement am Institut voran (Regeln, Datenmodell, Prozesse und Systeme) und unterstützen die domänenübergreifenden Steuerungs- und domänenspezifischen Arbeitsgruppen bei ihren Aktivitäten. Die Abteilung Research Services und Open Science des Fraunhofer IRB soll zukünftig als »Hüterin der Data Governance« agieren und die Implementierung, Einhaltung und Weiterentwicklung der Data Governance durchführen. Im Kontext des Forschungsdaten-Repositoriums Fordatis prüfen sie die Metadaten der Daten-Veröffentlichung (FORDATIS-Repository) und geben die Veröffentlichungen anschließend frei. Außerdem beraten sie Bibliotheks-Mitarbeitende/Datenkuratoren und Fraunhofer-Wissenschaftler und organisieren Schulungen zum Thema Forschungsdaten.

Die Domänenübergreifende Steuerungsgruppe besteht aus Domänen-Verantwortlichen und Führungskräften die eine langfristige Datenmanagementlösung entwickeln – unter Einbezug von zentralen Fragen wie bspw. des Personalaufwandes.

Der Chief Data Officer (CDO)/Forschungsbereichsleitende ist für die Planung und Steuerung der Daten der Organisation bzw. eines Forschungsinstitutes zuständig. Er verantwortet die Datenstrategie und vertritt die Perspektive der Forschungsdaten auf höchster Ebene.

Der Forschungsprozess der Zukunft

Für die Entwicklung einer übergreifenden Datenmanagement-Strategie für Forschungsdaten am Fraunhofer IAO werden derzeit im »HEFE«-Team die Themen Datenverwertung, Forschungsprozess, Aufbauorganisation als auch Infrastruktur und Systeme adressiert. Dabei werden übergreifende Rahmenbedingungen speziell für das Forschungsdatenmanagement zu Prozess und Metadatenstruktur geschaffen, wie ein übergreifender Forschungsprozess der Zukunft sowie ein dazugehöriges (Meta-)Datenmodell. Mit Hilfe eines Entscheidungsgremiums als Steuerungsgruppe aus Domänen-Verantwortlichen und Führungskräften werden grundlegende Aktivitäten erarbeitet. Parallel werden in einzelnen domänenspezifischen Arbeitsgruppen (Qualitative Forschungsdaten, Quantitative Forschungsdaten und Geodaten) (Meta-)Datenfelder definiert und Methoden-Checklisten entwickelt.

Aufbauorganisation »Data Governance« aus

  • Entscheidungsgremium
  • Data Governance Team für Regeln, Datenmodell, Prozesse und Systeme
  • Domänen-Arbeitsgruppen aus Wissenschaftlern
  • Bibliothek als Datenkuratoren

Unsere Domänenarbeitsgruppen erarbeiten Metadatenvorlagen und Checklisten, denen allen ein Forschungsprozess mit den folgende Phasen zugrunde liegt:

Phasen des Forschungsprozesses

  • Projektantrag
  • Forschungsdesign
  • Datensuche und -akquisition
  • Vorbereitung der Datenerhebung
  • Datenerhebung
  • Datenaufbereitung
  • Datenanalyse

Die beschriebenen Schritte innerhalb der Phasen sind in jeder Domäne unterschiedlich ausgeprägt.

Während der Projektbearbeitung kann zukünftig in jeder Phase ein iteratives Zusammenspiel zwischen Bibliothek, Fachberater aus den  Domänengremien und Wissenschaftlerinnen und Wissenschaftler stattfinden. Vorteil für Forschende ist, dass in frühen Phasen bereits eine Qualitätssicherung zu Rechtsfragen, Methodik und Datenstruktur stattfindet.

Domänenspezifische Checklisten zum methodischen Vorgehen im Forschungsprozess

Die beschriebenen Schritte innerhalb der Phasen sind in jeder Domäne unterschiedlich ausgeprägt.“ Aktuell gibt es die Domänen qualitative Leitfadengespräche, quantitative Befragungen, Bauwerksgeodaten sowie Mobilitätssensordaten. Zugehörige Checklisten für Forschende der angewandten Forschung, die Methodik mit Datenmanagement zusammenbringen, werden demnächst veröffentlicht.

1. Welche Organisations-, Kooperations- und ServiceStrukturen sind sinnvoll? Was sind Best Practices?
 

  • Möglichst viel möglichst zentral lösen (Synergiepotentiale heben)
  • Sinnvolle Grenzen ausloten ist Aufgabe der Data Governance
  • Wenige spezifische Metadatenfelder bei Domänen
     

2. Welche Kriterien haben Einfluss auf die Ausrichtung des Angebots?
 

  • Grad des Spezialistentums
    • Methodenmanagement zusätzlich zu Datenmanagement
    • Ähnliche Methoden in untersch. Abteilungen → koordinierendes Domänengremium
       

3. Wie gelingt die Aktivierung und Einbindung der unterschiedlichen Akteure und Stakeholder?
 

  • Führungskräfte
    • Ausrichtung des FDM an der Institutsstrategie
    • Daten als Führungsinstrument (Dashboards sind möglich)
  • Mitarbeiter
    • Interne Kommunikation: „Institutsfrühstück für Ausgeschlafene“ & „Café Express“
    • Jahreszielvereinbarungen
    • „Eigennutz“ durch nützliche Intranetvorlagen (Usability und Dienstleistungs-Tests der Angebote)
  • Fördergeber, Praxispartner: ?
     

4. Welche Strategien gibt es bezüglich der Nachhaltigkeit von Organisations- und GovernanceFormen für FDM-Angebote?
 

  • Attraktive Rollen als DomänenVerantwortliche
  • interne Services  zu DMPs Beratung zu Methodik, Onlinefragebogen aufsetzen, etc.
    • Gegen €/PM
    • Auf Basis Service Level Agreement (SLA)

Johannes Sautter

Contact Press / Media

Dipl.-Inf. Johannes Sautter

Projektleitung | Data-Governance-Spezialist

Fraunhofer IAO
Nobelstraße 12
70569 Stuttgart

Telefon +49 711 970-2387

Ekaterina Dobrokhotova

Contact Press / Media

MBA Ekaterina Dobrokhotova

Projektmanagement | Geschäftsmodelle

Fraunhofer IAO
Nobelstraße 12
70569 Stuttgart

Telefon +49 711 970-2367

Tina Klages

Contact Press / Media

Dr. Tina Klages

Forschungsdaten Policy | Geschäftsmodelle

Fraunhofer IRB
Nobelstraße 12
70569 Stuttgart

Telefon +49 711 970-2561

Jeannette  Anniés

Contact Press / Media

Jeannette Anniés

Policy-Strategie | Forschungsdaten-Vorlagen

Fraunhofer IAO
Nobelstraße 12
70569 Stuttgart

Andrea Wuchner

Contact Press / Media

Andrea Wuchner

Aufbauorganisation | Datenmodell | FORDATIS-Expertin

Fraunhofer IRB
Nobelstraße 12
70569 Stuttgart

Glossar: Relevante Terminologie HEFE

Domäne

Logische Gruppierung bestimmter Forschungsdaten, die mit einer bestimmten Methode erhoben wurden (z.B. Fragebögen) oder in einem bestimmten Datenformat gespeichert sind (bspw. Sensor-Geodaten mit Zeitbezug).

Am IAO/IAT gibt es im Rahmen des HEFE-Pilots Arbeitsgruppen von Wissenschaftlern, die sich regelmäßig treffen, um Methoden und Datenstandards zu diskutieren und zu beschließen. Diese Domänen sind:

Interviews

Fragebögen

Geodaten

  • Sensor-Geodaten mit Zeitbezug
  • Gebäude-Geodaten
  • Flächen und Punkt-Geodaten

Datensatz

Ein Datensatz ist eine Gruppe von inhaltlich zusammenhängenden Datenfeldern (bib. Metadaten) und Dateien, die im Rahmen eines Forschungsvorgehens entstanden sind. Im Rahmen eines Arbeitspakets eines Forschungsprojekts können bspw. ein oder zwei Datensätze entstehen (bspw. Befragung IAO/IAT-Mitarbeitender zu Anforderungen an Forschungsdatenmanagement: Je ein Datensatz zu den Zielgruppen wiss. Mitarbeitende und Dienstleistungsteams).

Datenkurator

Das HEFE-Team bzw. perspektivisch die IAO/IAT-Bibliothek pflegt und überprüft die Metadaten und Dateien eines Datensatzes.

Metadaten

Daten, die Informationen über andere Daten enthalten. Folgende Arten von Metadaten unterscheiden wir in HEFE:

  • Bibliographische Metadaten: Daten zum Zweck der Identifikation (bspw. Titel, Abstract/Zusammenfassung, Autor und Schlagwörter) sowie Methodische Texte, die auf Ebene des Datensatzes festgehalten werden. Informationen zu Entstehung, Erhebungszeitraum und Beschaffenheit der Daten.
  • Inhaltsbeschreibende Metadaten: Merkmale, Struktur und Versionierung strukturierter Daten (bspw. Spalten einer Tabelle), die auf Ebene der Dateien entweder beschrieben werden (bspw. Dateityp, Rohdatum vs. Aufbereitete Daten) oder in Dateien enthalten sind.

Dateien

Die eigentlichen Daten werden in der Regel als Dateien verarbeitet und abgelegt. Einem Datensatz sind eine oder mehrere Dateien zugeordnet. Diese haben einen bestimmten Dateityp (bspw. CSV, PDF oder RTF) und können nach folgenden Datenarten klassifiziert werden:

  • Rohdaten
  • Bereinigte Daten
  • Aggregierte Daten
  • Metadaten (Inhaltsbeschreibende Metadaten)

Forschungsdaten

Daten, die im Zuge wissenschaftlicher Vorhaben, z. B. durch Digitalisierung, Quellenforschungen, Experimente, Messungen, Erhebungen oder Befragungen entstehen (Allianz der deutschen Wissenschaftsorganisationen).

Wir unterscheiden zwischen Rohdaten (Primärdaten) und Analysedaten (Sekundärdaten), die beide in Dateien abgelegt werden.

JahrAutor/Titel/QuelleDokumentart
2019Sautter, Johannes; Boudjio, Erica; Litauer, Rebecca; Wuchner, Andrea:
Data Governance für Forschungsdaten der angewandten Stadtforschung: Vortrag gehalten auf dem DINI/nestor-Workshop "Strukturen entwickeln: Organisation und Governance für lokale FDM-Services"; Universität Siegen, 04. April 2019
(Workshop "Strukturen entwickeln - Organisation und Governance für lokale FDM-Services" <2019, Siegen>)
2019
Vortrag
2018Sautter, Johannes; Litauer, Rebecca; Fischer, Rudolf; Klages, Tina; Wuchner, Andrea; Müller, Elena; Schaj, Gretel; Dobrokhotova, Ekaterina; Drews, Patrick; Riess, Stefan:
Beyond data quality. Data excellence challenges from an enterprise, research and city perspective
(International Conference on Data Science, Technology and Applications (DATA) <7, 2018, Porto>)
In: Bernardino, Jorge (Ed.): DATA 2018, 7th International Conference on Data Science, Technology and Applications 2018. Proceedings: July 26-28, 2018, in Porto, Portugal. Setúbal: SciTePress, 2018, pp. 245-252
Konferenzbeitrag
Diese Publikationsliste wurde aus der Publikationsdatenbank Fraunhofer-Publica erstellt.