Il y a encore quelques années, pour tirer profit des données, les entreprises se contentaient de recruter des Data Scientists et des experts en Machine Learning.
Ces professionnels pouvaient construire des modèles prédictifs, permettant aux entreprises d’automatiser leurs flux de travail et de prendre des décisions clés.
Toutefois, les projets de Machine Learning échouaient au moment d’entrer en production. Les entreprises rataient des opportunités, et les clients étaient mécontents.
Pour cause, les Data Scientists se focalisent uniquement sur la construction de modèles de Machine Learning. Une fois entre les mains de l’utilisateur final, aucun système ne permettait de s’assurer que ces modèles fonctionnaient correctement dans le monde réel et dans un environnement différent de celui où ils ont été entraînés.
Or, le monde réel est imprévisible et change continuellement. C’est la raison pour laquelle les performances d’un modèle de Machine Learning peuvent radicalement varier d’un jour à l’autre.
Par exemple, le moindre changement dans la base de données d’entraînement peut impacter la précision du modèle. Ce phénomène est appelé « Data Drift » et doit être détecté rapidement pour mettre à jour le modèle avant qu’il ne soit biaisé.
De même, la saisonnalité provoque des changements réguliers et prévisibles sur les données à des intervalles de temps spécifiques. Les modèles de Machine Learning doivent être régulièrement mis à jour en tenant compte de ces changements saisonniers.
En outre, beaucoup de modèles de Machine Learning ne sont pas adaptés à la mise en production parce qu’ils ne peuvent prendre en charge les larges volumes de données entrant dans le système en temps réel.
Ces phénomènes liés au manque de procédures de déploiement des modèles de Machine Learning peuvent avoir un impact hautement négatif sur les performances des algorithmes en production. Afin de remédier à ce problème, le métier de MLOps (Machine Learning Operations) a vu le jour.
Un MLOps possède à la fois des compétences en Machine Learning et en opérations. Son rôle est de prendre en charge le workflow suivant la construction de modèle de Machine Learning.