Zum Hauptinhalt springen

Promotion Strategy

Kurzzusammenfassung

  • Promotion Strategy regelt den Weg vom validierten Candidate in den produktiven Betrieb.
  • Business-Nutzen: höhere Produktionsstabilität bei nachvollziehbaren Release-Entscheidungen.
  • BPMN-Leitpfad: Task Run promotion checks → Gateway All promotion gates passed? → Outcome Promote/hold/rollback.
  • Gate-Logik: Entspricht Gate C (Production Ready) mit explizitem Fallback.

Ziel

Promotion erfolgt nur bei erfüllten KPI-, Risiko-, Repro- und Betriebsanforderungen sowie dokumentierter Rollback-Strategie.

Ablauf

BPMN-SchrittMechanik (Task/Gateway/Outcome)Artefakte & Verantwortlich
Task: Build promotion dossierCandidate-Evidenz aus Tracking/Registry/Monitoring bündelnArtefakt: Promotion Dossier; Responsible: Model Owner
Task: Execute promotion gatesAutomatisierte + manuelle Checks (KPI, Drift-Risiko, Ops-Readiness)Artefakt: Gate Report; Responsible: MLOps + Risk
Gateway: All promotion gates passed?Entscheidung Promote/Hold/Reject mit AuflagenHold/Reject: Massnahmenplan; Accountable: Approval Board
Outcome: Promote/rollbackStage-Transition oder Rückfall auf letzte stabile VersionArtefakt: Release Decision

Kontrollen

Governance- und Risiko-Aspekte

  • Candidate muss reproduzierbar in Zielumgebung validiert sein.
  • Canary/Shadow-Rollout ist für kritische Use Cases verpflichtend.
  • Ausnahmen sind befristet und explizit freigegeben.

Messbare Akzeptanzkriterien

KriteriumGrenzwertVerantwortlichEskalation
Erfüllte Promotion-Gates vor Transition100 %Approval BoardPromotion-Block
KPI-Delta vs. Baseline (Primary KPI)≥ +2 % oder genehmigte AusnahmeModel OwnerHold + Review
Eskalationszeit bei Gate-Fail (prod-nah)≤ 30 minMLOps On-Call> 30 min: P1 Incident

Entscheidung

  • Promotion-Dossier und Gate-Report sind vollständig.
  • Reproduzierbarkeit und Transition sind verifiziert.
  • Rollback-/Incident-Plan ist freigegeben.

Übergang Research → Prod

  • technische Validität (Stabilität, Laufzeit)
  • fachliche Validität (Backtesting, Robustheit)
  • Governance-Freigabe (Risk/Compliance)

Rollback

Bei Drift oder KPI-Verletzung erfolgt Rückfall auf letzte freigegebene Version.

Trennung: Technische Promotion vs. fachliche Freigabe

Promotion wird in zwei strikt getrennte Entscheidungsräume aufgeteilt. Eine technische Freigabe ersetzt nicht die fachliche Freigabe.

EntscheidungsebeneZweckVerantwortlichErgebnis
Technische PromotionNachweis, dass Modell in Zielplattform sicher und stabil betrieben werden kannMLOps + ML Engineeringtech_ready = true/false
Fachliche FreigabeNachweis, dass fachlicher Nutzen, Risikoakzeptanz und Policy-Konformität erfüllt sindPM + Risk (ggf. Compliance)business_approved = true/false

Mindestgates technische Promotion

  • Reproduzierbarer Deploy-Build inkl. identischem Environment Fingerprint.
  • Erfolgreicher Smoke-/Canary-Test in prod-naher Umgebung.
  • Monitoring-, Alerting- und Rollback-Mechanik aktiv.

Mindestgates fachliche Freigabe

  • PM bestätigt Ziel-KPI und Business-Kontext.
  • Risk bestätigt Risikoakzeptanz, Limitkonformität und Ausnahmebehandlung.
  • Bei High-Risk-Use-Cases: Compliance-Zeichnung vorhanden.

Handshake mit PM/Risk-Gates (verpflichtend)

Die produktive Aktivierung erfolgt nur bei erfolgreichem Handshake zwischen Technik und Fachbereich.

SchrittGatePrüfnachweisBlocker
1TECH_GATE_PASSGate-Report mit Deploy-, Canary-, Monitoring-Checkstechnische Instabilität/offene Incidents
2PM_GATE_PASSPM-Freigabe mit KPI-Zielbild und Scopeunklarer Business-Impact
3RISK_GATE_PASSRisk-Freigabe inkl. Limit- und Szenarioprüfungoffene Risikoauflagen
4JOINT_RELEASE_ACKgemeinsamer Release-Record (PM + Risk + MLOps)fehlende End-to-End-Verantwortung

Handshake-Regeln:

  • Kein RISK_GATE_PASS ohne gültigen technischen Gate-Report.
  • JOINT_RELEASE_ACK ist nur innerhalb von 24h nach PM/Risk-Freigabe gültig; danach Re-Check.
  • Overrides sind zeitlich befristet und müssen ein exception_expiry enthalten.

Einheitliches Decision-Log-Feldset

Alle Promotionentscheidungen müssen mit dem Standard-Feldsatz aus Decision Logging dokumentiert werden.

FeldPflichtBeschreibung
decision_idJaEindeutige ID
decision_timestampJaUTC-Zeitstempel
decision_outcomeJaaccept, reject, override
decision_rationaleJaBegründung inkl. Gate-Status
tech_gate_report_refJaReferenz technischer Gate-Report
pm_gate_refJaReferenz PM-Freigabe
risk_gate_refJaReferenz Risk-Freigabe
joint_release_ack_refJagemeinsamer Handshake-Record
rollback_plan_refJaverknüpfter Rollback-Plan
exception_expiryBedingtPflicht bei Override