Open Source Software
Am Max-Planck-Institut für Bildungsforschung wird Open-Source Software entwickelt. Die nachfolgend genannten Projekte stehen zur kostenfreien Nachnutzung zur Verfügung:
Castellum
Castellum bietet eine zentrale und sichere Lösung für die datenschutzkonforme Verwaltung von Proband*innen-Daten während des gesamten Studienlebenszyklus.
Zu den Kernfunktionen gehören die Rekrutierung von Teilnehmenden anhand studienspezifischer Filter, die Verwaltung von Sitzungsterminen, die Generierung studienspezifischer Pseudonyme sowie die gezielte Überprüfung von Rechtsgrundlagen.
Als wichtiger Baustein im Forschungsdatenmanagement, bildet Castellum einen Teil des Serviceportfolios der Bibliothek und wissenschaftlichen Information.
Informationen zu Castellum finden Sie hier:
Ωnyx
Ωnyx ist eine Open-Source-Software für die visuelle Erstellung und Schätzung von Strukturgleichungsmodellen (SEM). Sie verfügt über eine benutzerfreundliche grafische Oberfläche, die den Prozess der Modellerstellung vereinfacht, sowie über eine robuste Berechnungsmaschine zur Durchführung der Maximum-Likelihood-Schätzung von Modellparametern. Darüber hinaus unterstützt Ωnyx die nahtlose Integration mit führender SEM-Software, einschließlich OpenMx, Lavaan und Mplus, indem es eine automatische Syntaxgenerierung bietet.
reproducibleRchunks
Statistische und komputationale Ergebnisse sind zentral für quantitative Methoden in der empirischen Forschung. Ihre Glaubwürdigkeit hängt von ihrer Reproduzierbarkeit ab - der Fähigkeit, identische Ergebnisse auf verschiedenen Computern oder demselben Computer zu einem späteren Zeitpunkt zu erhalten. In einer einflussreichen Studie konnten Artner und Kollegen nur 70 % der veröffentlichten Ergebnisse einer Stichprobe von empirischen Studien in der Psychologie reproduzieren (https://lnkd.in/emA_yBA5).
Inzwischen wurden verschiedene Strategien zur Verbesserung der Reproduzierbarkeit vorgeschlagen, wobei R Markdown als vielseitige Sprache für die Erstellung reproduzierbarer Forschungsergebnisse (wie Fachzeitschriftenartikel, Poster oder Präsentationen) hervorsticht, die oft in Kombination mit virtuellen Rechenumgebungen (z. B. Docker oder das renv-Paket) verwendet werden. Aber wie können wir testen, ob sich Analysen reproduzieren lassen, ohne in die Arbeitsabläufe der Forschenden einzugreifen?
Das R Paket reproducibleRchunks wurde entwickelt, um automatisch die Reproduzierbarkeit von Datenanalysen zu testen. Es führt einen neuen Code-Chunk-Typ in R Markdown-Dokumenten ein. Diese "reproducibleR"-Chunks speichern automatisch Metadaten über die ursprünglichen Berechnungsergebnisse und verifizieren spätere Reproduktionsversuche. Mit minimalen Anpassungen des Arbeitsablaufs können Forschende damit die Transparenz und Vertrauenswürdigkeit ihrer digitalen Forschungsergebnisse erhöhen.
Hier finden Sie unseren aktuellen PsyArXiv-Preprint mit der Dokumentation der Funktionalität des Pakets: https://t.co/J4pSSaD0N2 und wenn wir Ihr Interesse geweckt haben, können Sie das R-Paket hier herunterladen: https://lnkd.in/eriRs98z
Transformer Heads
Diese Bibliothek zielt darauf ab, ein Allround-Toolkit für das Verbinden, Trainieren, Speichern und Laden von neuen Köpfen für Transformatormodelle zu sein.
Ein neuer Kopf könnte sein:
- eine lineare Sonde, die dazu dient, die Informationsverarbeitung in einer Transformatorarchitektur zu verstehen
- Ein Kopf, der zusammen mit den Gewichten eines vortrainierten Transformatormodells feinabgestimmt wird, um eine völlig andere Art von Aufgabe zu erfüllen.
- Z.B. könnte einem Transformator, der für die kausale Sprachmodellierung vortrainiert wurde, ein Sequenzklassifizierungskopf angehängt werden, der für die Sentiment-Klassifizierung feinabgestimmt wird.
- Oder man könnte einen Regressionskopf anhängen, um ein großes Sprachmodell in eine Wertfunktion für ein Reinforcement-Learning-Problem zu verwandeln.
Darüber hinaus erleichtert das Anhängen mehrerer Köpfe das Multitasking-Lernen und ermöglicht das Trainieren sehr allgemeiner Modelle.