Label Construction
Zweck
Diese Seite beschreibt die versionierte Konstruktion von Trainings- und Backtesting-Labels. Ziel ist eine wiederverwendbare, leakage-freie Target-Logik mit klaren Übergaben an Training und Governance.
BPMN-Detailansicht
⋮⋮⋮
BPMN-Kontext
- IDs:
ScriptTask_LabelConstruction - Input-Bezug: Feature-Snapshots, Label-Regeln, Zeitfenster und Ausschlusslisten.
- Entscheidungsbezug: Leakage- und Plausibilitätsentscheidung vor Freigabe.
- Output-Bezug: Versionierter Label-Datensatz als Input für
CallActivity_TrainHPO.
Label Contract (Pflicht)
Jede Label-Definition wird als Contract dokumentiert und versioniert:
| Feld | Beschreibung | Beispiel |
|---|---|---|
label_id | Eindeutige Kennung der Label-Logik | equity.forward_return_5d |
label_version | SemVer für Logik/Parameter | 2.1.0 |
prediction_horizon | Zielhorizont inkl. Zeitzone | T+5, CET |
cutoff_policy | Erlaubte Daten bis Stichtag | Keine Daten nach 16:00 CET |
exclusion_rules | Ausschlüsse (Events, illiquide Titel, etc.) | Corporate Actions Exclude |
acceptance_tests | Messbare Qualitätskriterien | Coverage ≥ 95%, Leakage = 0 |
Versionierung und Change-Disziplin
- Jede Änderung an Berechnung, Parametern oder Ausschlusslogik erhöht
label_version. - Major-Versionen erfordern explizite Freigabe durch Model Owner und Risk.
- Trainingsläufe referenzieren immer
label_id+label_version+ Input-Feature-Version. - Historische Label-Versionen bleiben unverändert archiviert.
DQ-Übergabe an Training
- Label-Snapshot erzeugen und gegen Contract validieren.
- Leakage-Check, Coverage-Check und Klassengleichgewicht messen.
- Übergabe an Training nur bei bestandenem Abnahmeset.
- Ergebnis als Evidence-Record (Metriken + verantwortliche Freigabe) speichern.
Incident-Verknüpfung
- Bei Leakage-Fund oder kritischer Coverage-Abweichung wird ein Incident erstellt.
- Incident referenziert
label_id,label_version, betroffene Trainingsruns und erwarteten Business-Impact. - Re-Training bleibt blockiert, bis Ursache behoben und neue Label-Version freigegeben ist.
RACI
| Aktivität | Responsible | Accountable | Consulted | Informed |
|---|---|---|---|---|
| Target-Definition je Strategie | Quant Research | Head of Research | Risk, Data Steward | Portfolio Management |
| Leakage-Checks & Time-Alignment | ML Engineer | ML Lead | Quant Research | Governance |
| Freigabe Label-Spezifikation | Quant Research | Model Owner | Compliance | Stakeholder |
Siehe auch: Feature Store, Backtesting, Glossary, Traceability Matrix.