Das sind wir: Maike Kleemeyer

Forschungsdatenmanagement klingt für viele nach Aufwand – dabei steckt darin enormes Potenzial: für bessere Zusammenarbeit, nachhaltige Datenstrukturen und echte Zeitersparnis. Im Interview berichtet Maike Kleemeyer, Koordinatorin Forschungsdatenmanagement, wie sie durch persönliche Frustration über Datenchaos zum Fan klarer Strukturen wurde. Sie erklärt, warum sich ein durchdachtes Forschungsdatenmanagement nicht nur für Open Science, sondern auch für den eigenen Forschungserfolg lohnt.

Was hat Dich eigentlich dazu motiviert, Dich im Forschungsdatenmanagement (FDM) zu engagieren? 

Maike Kleemeyer: Rückblickend war es wohl der Moment, als ich begann, mit Daten aus anderen Projekten zu arbeiten – ohne zu wissen, wie diese organisiert waren. Ich fand es extrem mühsam, mich durch fremde Dateistrukturen zu wühlen und meine Analyseskripte ständig anpassen zu müssen. Zum Glück hatte ich es vor allem mit MR-Daten zu tun, für die mit BIDS (Brain Imaging Data Structure) ein Standard etabliert wurde. Der Einstieg war zunächst aufwendig, aber danach musste ich nie wieder Skripte umbauen oder Dateistrukturen entschlüsseln – ich konnte sofort mit der inhaltlichen Arbeit starten. Das war so überzeugend, dass ich immer tiefer ins FDM eingestiegen bin. 

Du bist die Koordinatorin für das Forschungsdatenmanagement am Institut. Kannst Du kurz erläutern, was man darunter versteht?   

Maike Kleemeyer: Forschungsdatenmanagement bezeichnet den Umgang mit entstehenden Forschungsdaten entlang ihres gesamten Lebenszyklus, von der Datenorganisation und -benennung, Beschreibung und Dokumentation über die Speicherung und den Datenschutz bis hin zur Veröffentlichung der Daten. Damit ist FDM ein wichtiger Grundpfeiler für Open Science, denn ein von Beginn an durchdachtes Datenmanagement minimiert den Aufwand für die Veröffentlichung (qualitativ hochwertiger) Daten. Zudem wird die Veröffentlichung zugrunde liegender Daten immer häufiger bei der Einreichung von Manuskripten verlangt. 

Was sind Deine täglichen Aufgaben? 

Maike Kleemeyer: Meine Aufgabe als FDM-Koordinatorin beinhaltet die Entwicklung und Umsetzung einer institutsübergreifende FDM-Strategie, also wo und wie lange werden Daten gespeichert, wie sind sie organisiert und dokumentiert und wie lässt sich ihre Nachnutzbarkeit ermöglichen? Derzeit finalisiere ich gemeinsam mit Kolleginnen und Kollegen eine FDM-Policy und eine Handreichung zur Umsetzung, die bald vorgestellt wird. Die Studienregistrierung ist zum Beispiel ein Teil dieser Strategie. Sie bietet einerseits einen zentralen Überblick über datenerhebende Studien des Instituts, andererseits legt sie automatisch Studienordner an, in denen sämtliches Studienmaterial (nicht nur Daten) gespeichert wird. Darüber kann ich Forschende entlang ihres spezifischen Daten-Lebenszyklus unterstützen, rechtzeitig relevante Dinge zu tun, um nicht am Ende vor einem riesigen Aufgabenberg zu stehen. Die E-Mails, die also den einen oder die andere nerven mögen, sollen tatsächlich dabei helfen, den Aufwand langfristig zu reduzieren. 
Natürlich berate ich Forschende unabhängig davon jederzeit gerne persönlich oder per E-Mail zu FDM-Themen. 

Welchen Herausforderungen begegnest Du bei der Implementierung einer institutsübergreifenden FDM-Strategie? 

Maike Kleemeyer: So sehr ich versuche, die Vorteile eines durchdachten FDM hervorzuheben, ist es für viele Forschende eine zeitintensive Nervensäge, die sie von ihrer eigentlichen Forschung abhält. Eine Herausforderung besteht also darin, einen angemessenen Mittelweg zu finden, um Forschende mit FDM-Anforderungen nicht zu überlasten, aber dennoch die notwendigen Informationen zu erhalten.
Eine weitere Herausforderung liegt in der heterogenen Forschung unseres Instituts, die sich in den zugehörigen Forschungsdaten widerspiegelt.  Eine MR-Studie mit mehreren Messzeitpunkten hat völlig andere Bedürfnisse und Anforderungen an das FDM als eine einmalige Online-Befragung. Die Strategie muss also gleichzeitig abstrakt genug sein, um den heterogenen Daten gerecht zu werden und konkret genug, um tatsächlich einen Effekt zu haben. Zudem haben die Forschungsbereiche zum Teil eigene Anforderungen formuliert, zu denen die institutsübergreifende FDM-Strategie passen muss, denn bestehende Prozesse zu verändern will sehr wohl begründet sein.   

Wie sensibilisierst Du Forscher*innen für den verantwortungsvollen Umgang mit Forschungsdaten? 

Maike Kleemeyer: In der Regel offenbaren sich die Vorteile eines guten Datenmanagements erst dann, wenn man einen Blick in den Datenordner eines anderen wirft. Dies geschieht jedoch häufig erst, wenn die Forschungslaufbahn bereits weiter fortgeschritten ist. Daher habe ich gemeinsam mit Kolleginnen und Kollegen von der Max Planck Digital Library (MPDL) und der Ludwig-Maximilians-Universität München (LMU) einen sehr praktischen Workshop konzipiert, der diese Erfahrung künstlich vorzieht. Häufig ist dies der beste Weg, um Forschende für einen verantwortungsvollen Umgang mit Daten zu sensibilisieren.
Einige, insbesondere junge Forschende sind sich dem Thema aber bereits sehr bewusst und möchten ihre Daten im Sinne von Open Science gerne veröffentlichen, sodass eine effektive Unterstützung hier relevanter ist als die Sensibilisierung. 

Gibt es bestimmte Best Practices oder Empfehlungen, die Du Forscher*innen für die Dokumentation und Veröffentlichung ihrer Daten geben würden? 

Maike Kleemeyer: Wenn ich all das hier schon verrate, braucht ja keiner mehr zu meinem Workshop zu kommen.  Aber Spaß beiseite – diese Themen sind tatsächlich zentrale Bestandteile meiner Workshops. 
Wenn ich die wichtigsten Grundlagen benennen müsste, die für eine sinnvolle und nachhaltige Nachnutzung von Forschungsdaten unerlässlich sind, wären es wohl diese vier Punkte: 1. das Zuweisen einer Lizenz (in der Regel CC0 oder CC-By), 2. die Nutzung offener, nachhaltiger Dateiformate (z.B. csv, tsv), 3. die Anfertigung einer README-Datei, welche den Datensatz und seinen Forschungskontext vorstellt und 4. die Anfertigung eines Codebooks, welches die spezifischen Inhalte des Datensatzes definiert. 

Gab es eine besonders inspirierende Erfahrung? 

Maike Kleemeyer: Während meines Postdocs hatte ich das Vergnügen für die Berliner Altersstudie II am Lifebrain Konsortium teilnehmen zu dürfen. In dem Konsortium hatte man sich bereits darauf geeinigt, BIDS als gemeinsamen, zugrundeliegenden Datenstandard zu verwenden. Dank dieser einheitlichen Struktur konnten wir in interdisziplinären Teams gemeinsam Analyse-Pipelines entwickeln, die direkt für alle funktionierten. Diese Form der reibungslosen, produktiven Zusammenarbeit war für mich ein echtes Aha-Erlebnis – und hat mein Verständnis von kollaborativer Forschung nachhaltig geprägt. 

Gibt es bestimmte Fähigkeiten oder Kenntnisse, die Du in Zukunft erlernen oder vertiefen möchtest und warum? 

Maike Kleemeyer: Ich stelle immer wieder fest, dass ich mit meinen rudimentären Programmierkenntnissen zu schnell an Grenzen stoße. Gerade wenn es darum geht, Forschende dabei zu unterstützen, ihre Daten etwas umzuorganisieren, z.B. von Wide-Format in Long-Format, möchte ich gerne in der Lage sein, ihnen schnell die Zeilen Code in R oder python schicken zu können. Hier freue ich mich darauf, meine Kenntnisse gezielt über Workshops zu vertiefen.

Weitere interessante Beiträge

Zur Redakteursansicht