Le MLOps (Machine Learning Operations) désigne l’ensemble des pratiques qui appliquent les principes du DevOps au cycle de vie des modèles de machine learning. L’objectif est de fiabiliser et d’industrialiser le passage d’un modèle de l’expérimentation à la production, puis son maintien dans le temps.
Là où le DevOps gère le cycle de vie du code, le MLOps ajoute deux dimensions propres au machine learning : les données et les modèles. Un pipeline MLOps couvre ainsi la préparation et le versionnage des données, l’entraînement et la validation des modèles, leur déploiement, puis leur surveillance en production. Cette dernière étape est essentielle car un modèle se dégrade naturellement avec le temps lorsque les données réelles s’éloignent de celles de l’entraînement, un phénomène appelé dérive (drift).
Le MLOps mobilise les mêmes fondations que le DevOps cloud-native : automatisation des pipelines, infrastructure as code, observabilité et reproductibilité. C’est pourquoi une organisation dont les fondations DevOps et cloud-native sont fragiles peinera à opérer ses modèles de façon fiable, quelle que soit la qualité de ces derniers.