Zum Hauptinhalt springen

Lineage

Kurzzusammenfassung

  • Lineage dokumentiert den End-to-End-Pfad von Quelle bis Modell- und Dashboard-Output.
  • Business-Nutzen: schnelle Impact-Analysen bei Daten- oder Modelländerungen.
  • BPMN-Leitpfad: Task Capture lineage edges → Gateway Critical chain complete? → Outcome Traceability published.
  • Gate-Logik: Für produktive Modelle ist vollständige Lineage Voraussetzung für Gate C.

Ziel

Kritische Datenprodukte (Features, Trainingssets, Modellversionen, Scoring-Outputs) sind über technische und fachliche Kanten lückenlos verbunden.

Ablauf

BPMN-SchrittMechanik (Task/Gateway/Outcome)Artefakte & Verantwortlich
Task: Capture edgesUpstream/Downstream-Knoten aus Pipelines und Jobs erfassenArtefakt: Lineage-Graph; Responsible: Platform Team
Task: Enrich contextKanten mit Run-ID, Commit, DQ-Status, Policy versehenArtefakt: Annotated Edges; Responsible: Data Engineering
Gateway: Critical chain complete?Prüft Pfad source → feature → training → registry → servingNein: Promotion blockiert; Accountable: Data Owner
Outcome: Publish traceabilityGraph versionieren und für Impact-Reports bereitstellenArtefakt: Impact Snapshot

Qualitätskriterien für Lineage-Kanten

QualitätsdimensionDefinitionZielwertMessmethode
VollständigkeitAnteil erwarteter Kanten, die technisch und fachlich vorhanden sind≥ 98 % kritische AssetsSoll/Ist-Abgleich je kritischem Datenprodukt
AktualitätZeit zwischen erfolgreichem Run und sichtbarer Kante im Katalog≤ 15 min (p95)Run-Timestamp vs. Lineage-Publish-Timestamp
Kritische PfadabdeckungAbdeckung des Muss-Pfads source → feature → training → model → serving100 % für produktive ModelleGate-C-Checkliste pro Modellversion
KontexttiefeAnteil Kanten mit owner, run_id, dq_status, policy_tag≥ 95 %Validierung der annotierten Edge-Attribute

Gate-Regeln auf Basis der Qualitätskriterien

  • Pass: alle drei Kernkriterien (Vollständigkeit, Aktualität, kritische Pfadabdeckung) im Zielbereich.
  • Warn: nur Aktualität verletzt, aber Pfadabdeckung vollständig; befristete Freigabe für max. 7 Tage.
  • Fail: kritische Pfadabdeckung < 100 % oder Vollständigkeit < 95 %; Gate C wird blockiert.

Kontrollen

Governance- und Risiko-Aspekte

  • Jede kritische Kante enthält Owner-Zuordnung.
  • Policy-Verletzungen sind im Graph als Flags sichtbar.
  • Modellversionen ohne Datensatz-Referenz sind unzulässig.

Messbare Akzeptanzkriterien

KriteriumGrenzwertVerantwortlichEskalation
Lineage-Vollständigkeit kritischer Assets≥ 98 %Data Steward< 95 %: Governance Escalation
Aktualisierung nach Deployment/Run≤ 15 minPlatform Team> 30 min: P2 Incident
Production-Modelle ohne vollständige Chain0MLOpssofortiger Promotion-Stop

Entscheidung

  • End-to-End-Chain ist für produktive Assets vollständig.
  • DQ-/Policy-Kontext ist pro relevanter Kante vorhanden.
  • Impact-Analyse ist ohne Zusatzrecherche möglich.

Zielbild

Durchgängige Lineage von Raw → Feature → Training → Model.

Erforderliche Verknüpfungen

  1. Quelle und Ingestion-Run
  2. Transformationsschritt und Regelwerk
  3. Feature-Version und Trainingsdatensatz
  4. Modellversion und Registry-Stage

Mehrwert

  • Root-Cause-Analyse bei Modellabweichungen
  • Wirkungsketten für Change- und Incident-Management
  • Auditierbarkeit für Risk/Compliance