Zum Hauptinhalt springen

Flows

Kurzzusammenfassung

  • Prefect Flows setzen die BPMN-Teilprozesse ausführbar um (Feature Pipeline, Retrain, Scoring).
  • Business-Nutzen: reproduzierbare Automatisierung mit klaren Übergaben zwischen Data, ML und Ops.
  • BPMN-Leitpfad: Task Execute flow/subflow → Gateway Rule branch → Outcome State transition.
  • Betriebsregel: jeder Flow läuft nur als versioniertes Deployment mit Owner und Runbook.

Ziel

Jeder BPMN-Schritt ist in Prefect als Flow/Task eindeutig abgebildet und liefert nachvollziehbare State-Transitions bis zum Incident-Fallback.

Ablauf

BPMN-SchrittMechanik (Task/Gateway/Outcome)Artefakte & Verantwortlich
Task: Implement flow graphBPMN-Tasks als Prefect Tasks/Subflows modellierenArtefakt: Flow-Code + Tests; Responsible: Data Engineering
Task: Build & publish deploymentWork Pool, Image, Parameter, Tags, Infra-Block konfigurierenArtefakt: Deployment Spec; Responsible: Platform Team
Gateway: Rule branchBranching anhand DQ/Business Rules (Completed, Failed, Cancelled)Artefakt: State Event Log; Accountable: Tech Lead
Outcome: State transition finalizedErgebnis wird an Folgeschritt/Incident weitergegebenArtefakt: Run Summary + Links

Kontrollen

Governance- und Risiko-Aspekte

  • Deployment-Version muss auf BPMN-Version referenzieren.
  • Kritische Flows benötigen dokumentierte Manual-Intervention-Tasks.
  • Failure-State muss Incident-Handover triggern.

Messbare Akzeptanzkriterien

KriteriumGrenzwertVerantwortlichEskalation
BPMN-Task-Mapping im Deployment dokumentiert100 %Data Engineeringfehlend: Merge-Block
Produktive Deployments ohne Runbook0Platform Teamsofortiger Deploy-Stop
Incident-Link nach Failed State≤ 10 minPlatform Ops> 15 min: Incident Manager

Entscheidung

  • Flow/Task-Mapping ist vollständig und versioniert.
  • State-Transitions sind reproduzierbar und nachvollziehbar.
  • Incident-Fallback ist automatisiert getestet.
⋮⋮⋮

Glossar-Begriffe

Diese Seite nutzt die kanonischen Begriffe Data Pipeline, Feature, Retrain Trigger und Prefect.

BPMN → Prefect Abbildung

  • BPMN Process entspricht einem End-to-End Prefect Flow
  • CallActivity entspricht einem Subflow
  • BusinessRuleTask entspricht Validierungs-Tasks mit Gate-Entscheidung
  • Gateway entspricht conditional branching im Flow

Flow, Deployment, Work Pool, Worker, Block, State

Verantwortlichkeiten im Prefect-Betriebsmodell

BegriffPrimäre VerantwortungTypische Owner-RolleWichtige Schnittstellen
FlowOrchestrierungslogik definieren (Tasks/Subflows, Retries pro Task, Parameter)Data/ML EngineeringDeployment, Blocks, States
DeploymentVersionierbare Laufzeitdefinition eines Flows (Code-Referenz, Parameter, Schedule, Tags, Work Pool)MLOps / PlatformWork Pool, Trigger, Incident-Payload
Work PoolRouting-Regeln und Ausführungsinfrastruktur bereitstellen (z. B. Kubernetes, Docker, Process)Platform TeamWorker, Concurrency-Limits, Prioritäten
WorkerRuns aus einem Work Pool pollen, Infrastruktur starten und Run-Status an Prefect zurückmeldenPlatform OpsWork Pool, Execution Environment, Logs
BlockWiederverwendbare Konfiguration/Secrets/Storage abstrahieren (z. B. S3, GCS, Credentials, Notification)Platform + SecurityFlow/Deployment-Konfiguration, Secret-Rotation
StateLaufstatus und Übergänge als Audit-Trail führen (Scheduled, Pending, Running, Completed, Failed, Cancelled, Crashed, Late)Prefect API + OperationsMonitoring, Failure Handling, Incident Management

Operative Leitplanken

  • Flow ist fachliche Wahrheit, Deployment ist operative Wahrheit: Ein Flow ohne Deployment ist nicht produktionsfähig.
  • Work Pool/Worker trennen Steuerung und Ausführung: Capacity- und Priorisierungsregeln liegen im Work Pool, nicht im Flow-Code.
  • Blocks entkoppeln Runtime von Secret-Details: Secrets werden nicht im Code gespeichert, sondern per Block-Referenz eingebunden.
  • State-Transitions sind die führende Incident-Quelle: Alerting, SLA-Messung und Eskalation basieren auf Prefect States.

BPMN-Kontext

  • IDs: CallActivity_FeaturePipeline
  • Input-Bezug: Curated Daten, Feature-Definitionen und Pipeline-Parameter.
  • Entscheidungsbezug: Entscheid über erfolgreiche Materialisierung oder Rückgabe in Fehler-/Quarantänepfad.
  • Output-Bezug: Versionierte Features für Labeling, Training und Scoring.