Zugriff auf den JupyterHub
Über den folgenden Link gelangen Sie direkt zur JupyterHub-Arbeitsumgebung:
https://fdz-support.risikoanalytik.de/
Testzugang: User: fdz-support1 PWD: cut3Town28-
Für eine persönlichen Zugang bitte: Beratungstermin buchen
Grundfunktionen des JupyterHub
Die Arbeitsumgebung basiert vollständig auf dem Browser und bietet alle Werkzeuge für die Erstellung synthetischer Studienpopulationen.
1. Datei-Browser
- das Create_Studypop.ipynb Notebook und die dazu gehörige config_createstudypop.py
- die Ordner Results, Definitions, PUF_DM3_mini und Copilot Instructions
2. DER Daten ORDNER
- Im Ordner PUF_DM3_mini liegen die vom FDZ unter https://zenodo.org/records/15057924 veröffentlichten PUF_DM3.zip Daten.
- Diese wurden zur Laufzeitoptimierung mit identischer Datenstruktur auf 33% gekürzt.
3. Der Definitions-Ordner
Der Ordner definitions/ enthält alle definitions_XXX.csv Tabellen welche zur Definition der in der Studienpopulation zu synthetisierenden Codes für die verschiedenen Tabellen z.B.:
*_ICD.csv– Diagnosen für KHDIAG und AMBDIAG*_OPS.csv– Prozeduren für KHPROZ und AMBOPS*_PZN.csv– Medikamente für REZ und EZD
Die Benennung der definitions Tabellen sollen den Namen und den Codetyp enthalten - siehe Beispiele rechts Gestangen_PZN.csv
4. Der RESULTS Ordner
Alle Tabellen der synthetisierten Studienpopulation werden automatisch im Ordner:
results/<version>_<studienname>/
mit Tabellen und Spatennamen identisch zu den FDZ Echtdaten erstellt. Der Tabellenname erhält jeweils den Präfix "datrav_"
datrav_KHDIAG.csvdatrav_AMBDIAG.csvdatrav_REZ.csvdatrav_KHPROZ.csv/datrav_AMBOPS.csv
5. DAS CREATE STUDYPOP Notebook
- Oben-links in der Navigationsleiste auf "Kernel" und danach auf "Restart Kernel and Run All Cells" gedrückt werden
- Oder durch Klicken in die einzelne Zellen und das Klicken des "Run" Symbols wie im Bild Links zu sehen gedrückt werden
6. Die CREATE STudypop Config
Die Config Studypop definiert alle Konfigurationen für die Erzeugung der synthetischen Studienpopulation.
Im Header der Config werden dabei zwei Grundlegende Variablen festgelegt – Studienname (disease) und Studienversion (version) – anhand derer sämtliche Pfade, Ergebnisordner und Verarbeitungsschritte automatisch gesteuert werden.
Hauptfunktionen der Header-Parameter:
-
disease: bestimmt, für welche Studie die Datenmodifikation ausgeführt wird (z. B. „ABARO“).
-
version: steuert die Versionierung der Ergebnisse und legt automatisch den Ausgabeordner
results/{version}_{disease}an.
PUF_DM3 Mini Dateien

Definitions Ordner

Results Ordner

einzeln Zellen ausführen

Header Studypop COnfig

Run all Cells


dATEI bROWSER


