Zum Hauptinhalt springen

Model Registry

Kurzzusammenfassung

  • Model Registry steuert kontrollierte Stage-Transitions von Research bis Production.
  • Business-Nutzen: weniger Produktionsrisiko durch nachvollziehbare Freigaben.
  • BPMN-Leitpfad: Task Register candidate version → Gateway Transition gates passed? → Outcome Stage changed/held.
  • Qualitätsregel: Keine Transition ohne vollständiges Validierungs- und Repro-Paket.

Ziel

Registry-Transitions sind technisch, fachlich und regulatorisch abgesichert und über Audit-Trail nachvollziehbar.

Ablauf

BPMN-SchrittMechanik (Task/Gateway/Outcome)Artefakte & Verantwortlich
Task: Register candidate versionCandidate-Run als Modellversion anlegenArtefakt: Model Version; Responsible: ML Engineer
Task: Attach validation packagePerformance-, Robustheits-, Bias-, Betriebschecks anhängenArtefakt: Validation Package; Responsible: ML Validation
Gateway: Transition gates passed?Checks für Quality/Risk/Repro/Ops-ReadinessNein: Stage hold; Accountable: Model Owner
Outcome: Stage changed/heldTransition zu Staging/Production oder Halt mit AuflagenArtefakt: Transition Decision Log

Kontrollen

Governance- und Risiko-Aspekte

  • Für Production sind fachlicher + technischer Sign-off Pflicht.
  • Registry-Objekt referenziert Daten-, Feature- und Code-Version.
  • Rollback-Kandidat muss vor Production-Transition existieren.

Messbare Akzeptanzkriterien

KriteriumGrenzwertVerantwortlichEskalation
Vollständiges Validation Package bei Transition100 %ML ValidationTransition-Block
Durchlaufzeit Stage-Review≤ 2 ArbeitstageModel Owner> 2 Tage: Governance Board
Prod-Modelle ohne Rollback-Kandidat0MLOpssofortige P1-Eskalation

Entscheidung

  • Transition-Gates sind vollständig geprüft und signiert.
  • Registry-Eintrag enthält alle Referenzartefakte.
  • Rollback-Readiness ist nachgewiesen.

Stage-Transition-Gates (verpflichtend)

Jede Stage-Transition ist nur zulässig, wenn alle Gate-Nachweise vorliegen und versioniert referenziert sind.

TransitionGatePflichtnachweisAblehnungsgrund
Research → StagingBacktest-GateBacktest-Report mit Zeitraum, Kostenmodell, KPI-Delta vs. BaselineKein belastbarer Out-of-Sample-Nachweis
Research → StagingDrift-Baseline-GateDokumentierte Drift-Baseline (Features + Targets) inkl. SchwellenwerteKeine Baseline für späteres Drift-Monitoring
Staging → ProductionApproval-Record-GateSignierter Approval-Record (Model Owner, Risk, ggf. Compliance)Fehlender/unklarer Freigabeentscheid
Staging → ProductionRollback-Plan-GateAusführbarer Rollback-Plan mit RTO/RPO, Triggern und VerantwortlichenKein testbarer Rückfallpfad

Mindestanforderungen je Pflichtnachweis

  • Backtest: enthält mindestens Datenfenster, Turnover-/Kostenannahmen, KPI-Unsicherheit (z. B. Konfidenzintervall) und Failure-Cases.
  • Drift-Baseline: enthält Referenzverteilungen, Segmentierung, Alert-Schwellen und Verantwortliche für Re-Baselining.
  • Approval-Record: enthält Entscheider, Entscheidung, Bedingungen, Laufzeit von Ausnahmen und Verweis auf Evidenz.
  • Rollback-Plan: enthält technische Schritte, Kommunikationsplan, maximal akzeptierte Downtime und letzte stabile Version.

Einheitliches Decision-Log-Feldset

Alle Stage-Entscheidungen (promote, hold, reject) nutzen den einheitlichen Feldsatz gemäss Decision Logging.

FeldPflichtBeschreibung
decision_idJaEindeutige ID
decision_timestampJaUTC-Zeitpunkt
decision_outcomeJaaccept, reject, override
decision_rationaleJaEntscheidungsbegründung
registry_model_versionJaBetroffene Modellversion
target_stageJaZielstage (staging/production)
backtest_report_refJaReferenz auf Backtestnachweis
drift_baseline_refJaReferenz auf Drift-Baseline
approval_record_refJaReferenz auf Freigabedokument
rollback_plan_refJaReferenz auf Rollback-Plan

Glossar-Begriffe

Diese Seite nutzt die kanonischen Begriffe Model, Promotion, MLflow Model Version und Registry Stage.

Versionierung

Jede Modellversion verweist auf Trainingsdaten, Code-Commit und Evaluationsreport.

Stages

  • Research
  • Staging
  • Production
  • Archived