Zum Hauptinhalt springen

Glossary

Nutzung

Nutze dieses Glossar als Referenz beim Lesen der Docs: Begriffe sind kanonisch definiert, konsistent benannt und direkt mit den relevanten Kapiteln verknüpft.

Glossarbegriffe

BegriffBedeutungSynonyme (optional)Nicht verwenden (optional)Zugehörige BPMN-KnotenPrimärseite
SignalZeitbezogene, fachlich interpretierbare Aussage mit Entscheidungsrelevanz.Indikator, HinweisAlert (ohne fachlichen Kontext)ServiceTask_Scoring, ServiceTask_Monitor/docs/platform/concepts#1-signal
FeatureReproduzierbar berechnete Eingangsvariable für Modelle mit Versionierung und DQ-Status.Merkmal, PredictorSpalte (wenn keine Feature-Definition vorliegt)CallActivity_FeaturePipeline, Gateway_DQDecision/docs/platform/concepts#2-feature
ModelVersionierte Abbildungslogik, die aus Features eine Vorhersage oder Empfehlung erzeugt.ML-ModellAlgorithmus (wenn Run-/Version-Kontext fehlt)CallActivity_TrainHPO, ServiceTask_Deploy/docs/platform/concepts#3-model
Data ProductFachlich verantwortetes, wiederverwendbares Datenangebot mit SLA und Governance-Regeln.DatenproduktDataset (wenn Ownership/SLA unklar sind)CallActivity_DataPipeline, CallActivity_PurposeGate/docs/platform/concepts#4-data-product
PromotionKontrollierter Stage-Übergang einer Modellversion auf Basis dokumentierter Gates.Stage TransitionDeployment (wenn keine Stage-Entscheidung gemeint ist)Gateway_Acceptance, UserTask_Approval/docs/platform/concepts#5-promotion
Data PipelineOrchestrierte Verarbeitungskette von Ingestion bis publiziertem Output.ELT-PipelineDatapipeline (uneinheitliche Schreibweise)CallActivity_DataPipeline, StartEvent_Timer/docs/orchestration-prefect/flows
DQData Quality inklusive Regeln, Schwellen und Entscheidungslogik.Data QualityQualität ok (ohne Messkriterium)CallActivity_QualityGate, Gateway_DQDecision/docs/data-catalog-openmetadata/data-quality
LineageNachvollziehbare Herkunft und Transformation von Daten und Modellartefakten.DatenherkunftHistorie (ohne Transformationen)CallActivity_DataPipeline, CallActivity_FeaturePipeline/docs/data-catalog-openmetadata/lineage
Feature StoreVersionierte Verwaltung, Bereitstellung und Reuse von Features.Feature RepositoryFeature-Tabelle (ohne Versionskonzept)CallActivity_FeaturePipeline/docs/data/feature-store
OpenMetadataMetadatenkatalog für Datenobjekte, Owner, Purpose und Lineage.Metadata CatalogKatalog (wenn Tool-spezifischer Kontext fehlt)CallActivity_DataPipeline, CallActivity_PurposeGate/docs/data-catalog-openmetadata/ingestion
PrefectOrchestrierungsplattform für Flows, Deployments und Run-State-Management.Workflow OrchestratorScheduler (wenn nur Zeittrigger gemeint ist)StartEvent_Timer, CallActivity_RetrainJob/docs/orchestration-prefect/flows
MLflowPlattform für Experiment-Tracking, Artefakte und Model Registry.ML Lifecycle ToolingRegistry (wenn nur Run-Tracking gemeint ist)CallActivity_TrainHPO, CallActivity_BacktestValidation/docs/ml-lifecycle-mlflow/tracking
MLflow Model VersionEindeutig versioniertes Modellobjekt in der Registry mit Referenz auf Run und Artefakte.Registered Model VersionModel (ohne Versionsbezug)UserTask_Approval, ServiceTask_Deploy/docs/ml-lifecycle-mlflow/model-registry
Registry StageFreigabestatus einer Model Version (z. B. Research, Staging, Production).StageUmgebung (wenn Governance-Status gemeint ist)Gateway_Acceptance, EndEvent_Live/docs/ml-lifecycle-mlflow/promotion-strategy
DriftStatistische Veränderung von Datenverteilung oder Modellverhalten über die Zeit.Data Drift, Concept DriftAbweichung (ohne Referenzbaseline)ServiceTask_Monitor, Gateway_Retrain/docs/observability/drift
Retrain TriggerDokumentiertes Ereignis oder Schwellenwert, der ein erneutes Training auslöst.Retraining TriggerNeu trainieren (ohne Trigger-Policy)Gateway_Retrain, CallActivity_RetrainJob/docs/orchestration-prefect/scheduling

Glossarbegriff → Kapitelowner

GlossarbegriffKapitelownerPflegeverantwortung
Signal, Drift, Retrain TriggerObservability + ML OpsDefinitionen, Triggerkriterien, Monitoring-Begriffe synchron halten
Feature, Feature Store, Label ConstructionData & ML EngineeringFeature-Semantik, Versionierung und Qualitätsbegriffe pflegen
Model, MLflow Model Version, Registry Stage, PromotionML Lifecycle / MLOpsRun/Registry-Terminologie und Freigabebegriffe konsistent halten
Data Product, Lineage, DQ, OpenMetadataData Governance + Data PlatformMetadaten-, Governance- und Qualitätsbegriffe zentral steuern
Data Pipeline, PrefectPlatform EngineeringOrchestrierungsbegriffe und BPMN-Task-Namen harmonisieren