Zum Hauptinhalt springen

Deployment

Kurzzusammenfassung

  • Diese Seite definiert den verbindlichen Go-Live-Handshake zwischen Model Owner, MLOps und Betrieb.
  • Ziel ist ein reproduzierbarer Produktivgang mit klaren Abnahmekriterien statt impliziter Freigaben.
  • Jeder Release muss Rollback-fähig und durch ein vollständiges Release-Paket auditierbar sein.
  • Die Betriebsübergabe ist erst abgeschlossen, wenn Ownership, On-Call und Evidenzen dokumentiert sind.

Ziel

Business-Nutzen: Reduziert Produktionsrisiko, beschleunigt Incident-Recovery und schafft Revisionssicherheit für produktive Modellentscheidungen.

BPMN-Detailansicht

⋮⋮⋮

BPMN-Kontext

  • IDs: ServiceTask_Deploy, EndEvent_Live
  • Input-Bezug: Signiertes Release-Paket, freigegebene Modellversion, Betriebsfreigabe.
  • Entscheidungsbezug: Go/No-Go auf Basis von Abnahmecheckliste, Canary-Ergebnis und Rollback-Readiness.
  • Output-Bezug: Modell ist produktiv (EndEvent_Live) inklusive dokumentierter Betriebsübernahme.

Verbindliche Go-Live-Abnahmekriterien

Alle Kriterien müssen vor Aktivierung grün sein:

BereichKriteriumEvidenz
ModellfreigabeRegistry-Status Production oder freigegebener Alias (prod/champion)Registry-Screenshot/Run-Link
ArtefaktintegritätSignatur- und Checksum-Prüfung erfolgreichBuild-/Deploy-Log
Technische FunktionSmoke-Test und Health-Endpunkte (/health, /ready) erfolgreichTestprotokoll
QualitätsgateKPI-Schwellen gemäss Acceptance-Kriterien eingehaltenFreigabeprotokoll Risk/Quant
SicherheitService-Account, Secrets, Netzwerkpolicy geprüftSecurity-Checklist
BetriebMonitoring, Alerting, Runbook und On-Call aktivObservability-Link + On-Call-Rotation

Rollback-Readiness (Pflicht)

Rollback gilt nur als bereit, wenn:

  1. Vorversion deploybar ist (Image/Artefakt verfügbar, Konfig kompatibel).
  2. Rollback-Trigger definiert sind (z. B. Fehlerquote, Latenz, KPI-Drift).
  3. Rollback-Test im Staging innerhalb der letzten 30 Tage dokumentiert wurde.
  4. RTO/RPO für Rückfall benannt sind (z. B. RTO ≤ 15 min, RPO = 1 Release).

Release-Paket (Minimalinhalt)

Ein Release ohne vollständiges Paket darf nicht live gehen.

BestandteilPflichtinhalt
Deployment-ManifestImage-Digest, Config-Version, Zielumgebung, Startparameter
Modell-MetadatenModel-ID, Version, Registry-Stage/Alias, Trainings-Run-ID
Daten-/Feature-ReferenzenFeature-Set-Version, Snapshot-IDs, Schema-Hash
QualitätsnachweiseBacktest-/Validation-Referenz, Acceptance-Ergebnis
BetriebsdokumenteRunbook, Alert-Regeln, Eskalationskette, Rollback-Anleitung
FreigabenSign-off von Model Owner, Risk, Platform Ops

Betriebsübergabe (Operational Handover)

Die Übergabe ist verbindlich abgeschlossen, wenn folgende Punkte im Ticket/Change-Record hinterlegt sind:

  • Primärer und sekundärer Service Owner benannt.
  • On-Call-Kanal und Incident-Pfad (L1→L2→L3) verknüpft.
  • Wartungsfenster, Supportzeiten und SLA-Verantwortliche dokumentiert.
  • Link auf Dashboard, Logs, Traces und Alert-Runbook vorhanden.
  • Übergabe-Meeting protokolliert (Datum, Teilnehmer, offene Risiken).

Entscheidung

  • Go-Live-Abnahmekriterien vollständig erfüllt.
  • Rollback-Readiness nachweislich gegeben.
  • Release-Paket vollständig und signiert.
  • Betriebsübergabe mit klarer Ownership abgeschlossen.