Label Construction

Zweck

Diese Seite beschreibt die versionierte Konstruktion von Trainings- und Backtesting-Labels. Ziel ist eine wiederverwendbare, leakage-freie Target-Logik mit klaren Übergaben an Training und Governance.

BPMN-Detailansicht

⋮⋮⋮

BPMN-Kontext

IDs: ScriptTask_LabelConstruction
Input-Bezug: Feature-Snapshots, Label-Regeln, Zeitfenster und Ausschlusslisten.
Entscheidungsbezug: Leakage- und Plausibilitätsentscheidung vor Freigabe.
Output-Bezug: Versionierter Label-Datensatz als Input für CallActivity_TrainHPO.

Label Contract (Pflicht)

Jede Label-Definition wird als Contract dokumentiert und versioniert:

Feld	Beschreibung	Beispiel
`label_id`	Eindeutige Kennung der Label-Logik	`equity.forward_return_5d`
`label_version`	SemVer für Logik/Parameter	`2.1.0`
`prediction_horizon`	Zielhorizont inkl. Zeitzone	`T+5, CET`
`cutoff_policy`	Erlaubte Daten bis Stichtag	Keine Daten nach 16:00 CET
`exclusion_rules`	Ausschlüsse (Events, illiquide Titel, etc.)	Corporate Actions Exclude
`acceptance_tests`	Messbare Qualitätskriterien	Coverage ≥ 95%, Leakage = 0

Versionierung und Change-Disziplin

Jede Änderung an Berechnung, Parametern oder Ausschlusslogik erhöht label_version.
Major-Versionen erfordern explizite Freigabe durch Model Owner und Risk.
Trainingsläufe referenzieren immer label_id + label_version + Input-Feature-Version.
Historische Label-Versionen bleiben unverändert archiviert.

DQ-Übergabe an Training

Label-Snapshot erzeugen und gegen Contract validieren.
Leakage-Check, Coverage-Check und Klassengleichgewicht messen.
Übergabe an Training nur bei bestandenem Abnahmeset.
Ergebnis als Evidence-Record (Metriken + verantwortliche Freigabe) speichern.

Incident-Verknüpfung

Bei Leakage-Fund oder kritischer Coverage-Abweichung wird ein Incident erstellt.
Incident referenziert label_id, label_version, betroffene Trainingsruns und erwarteten Business-Impact.
Re-Training bleibt blockiert, bis Ursache behoben und neue Label-Version freigegeben ist.

RACI

Aktivität	Responsible	Accountable	Consulted	Informed
Target-Definition je Strategie	Quant Research	Head of Research	Risk, Data Steward	Portfolio Management
Leakage-Checks & Time-Alignment	ML Engineer	ML Lead	Quant Research	Governance
Freigabe Label-Spezifikation	Quant Research	Model Owner	Compliance	Stakeholder

Siehe auch: Feature Store, Backtesting, Glossary, Traceability Matrix.

Zweck​

BPMN-Detailansicht​

BPMN-Kontext​

Label Contract (Pflicht)​

Versionierung und Change-Disziplin​

DQ-Übergabe an Training​

Incident-Verknüpfung​

RACI​