Zugriff auf den JupyterHub

Über den folgenden Link gelangen Sie direkt zur JupyterHub-Arbeitsumgebung:

https://fdz-support.risikoanalytik.de/

Testzugang: User: fdz-support1 PWD: cut3Town28-

Für eine persönlichen Zugang bitte: Beratungstermin buchen

Grundfunktionen des JupyterHub

Die Arbeitsumgebung basiert vollständig auf dem Browser und bietet alle Werkzeuge für die Erstellung synthetischer Studienpopulationen.

1. Datei-Browser

Auf der Linken Seite im Browser Fenster des FDZ-Jupyterhubs finden Sie einen Datei Browser, dieser enthält folgendes:
  • das Create_Studypop.ipynb Notebook und die dazu gehörige config_createstudypop.py
  • die Ordner Results, Definitions, PUF_DM3_mini und Copilot Instructions

2. DER Daten ORDNER

  • Im Ordner PUF_DM3_mini liegen die vom FDZ unter https://zenodo.org/records/15057924 veröffentlichten PUF_DM3.zip Daten. 
  • Diese wurden zur Laufzeitoptimierung mit identischer Datenstruktur auf 33% gekürzt.

3. Der Definitions-Ordner

Der Ordner definitions/ enthält alle definitions_XXX.csv Tabellen welche zur Definition  der in der Studienpopulation zu synthetisierenden Codes für die verschiedenen Tabellen z.B.:

  • *_ICD.csv – Diagnosen für KHDIAG und AMBDIAG
  • *_OPS.csv – Prozeduren für KHPROZ und AMBOPS
  • *_PZN.csv – Medikamente für REZ und EZD

Die Benennung der definitions Tabellen sollen den Namen und den Codetyp enthalten - siehe Beispiele rechts Gestangen_PZN.csv

 4. Der RESULTS Ordner

Alle Tabellen der synthetisierten Studienpopulation werden automatisch im Ordner:

results/<version>_<studienname>/

mit Tabellen und Spatennamen identisch zu den FDZ Echtdaten erstellt. Der Tabellenname erhält jeweils den Präfix "datrav_"

  • datrav_KHDIAG.csv
  • datrav_AMBDIAG.csv
  • datrav_REZ.csv
  • datrav_KHPROZ.csv / datrav_AMBOPS.csv

5. DAS CREATE STUDYPOP Notebook

In der Jupyterhub Umgebung können Jupyter Notebooks mit einzelnen Code Zellen erstellt und auch einzeln ausgeführt werden. Um das gesamte Notebook laufen zu lassen muss entweder:
  • Oben-links in der Navigationsleiste auf "Kernel" und danach auf "Restart Kernel and Run All Cells" gedrückt werden
  • Oder durch Klicken in die einzelne Zellen und das Klicken des "Run" Symbols wie im Bild Links zu sehen gedrückt werden


6. Die CREATE STudypop Config


Die Config Studypop definiert alle Konfigurationen für die Erzeugung der synthetischen Studienpopulation.
Im Header der Config werden dabei zwei Grundlegende Variablen festgelegt – Studienname (disease) und Studienversion (version) – anhand derer sämtliche Pfade, Ergebnisordner und Verarbeitungsschritte automatisch gesteuert werden.

Hauptfunktionen der Header-Parameter:

  • disease: bestimmt, für welche Studie die Datenmodifikation ausgeführt wird (z. B. „ABARO“).

  • version: steuert die Versionierung der Ergebnisse und legt automatisch den Ausgabeordner results/{version}_{disease} an.

PUF_DM3 Mini Dateien
Image
Definitions Ordner
Image
Results Ordner
Image
einzeln Zellen ausführen
Image
Header Studypop COnfig
Image
Run all Cells
Image
Image
dATEI bROWSER
Image