Opérations d’apprentissage automatique (MLOps)

Stratégies pratiques pour exécuter avec succès des projets ML

On Demand

  : 09h00 - 16h30

Fin : JJ-MM-YYYY

Durée :2,0 jours

Numéro de l'événement : CFADC.00.00B

         Au Choix


PDF

à partir de
£ ACA0,00 euro
(hors TVA)

Objectifs de la formation continue :

Dans cet atelier, vous découvrirez des stratégies pratiques pour surmonter les défis courants dans le domaine de l’apprentissage automatique. Vous apprendrez à utiliser des outils populaires pour la gestion des données, l’orchestration des processus d’un pipeline ML, et la mise en production continue. Les principaux objectifs sont :

  • Gérer efficacement les données, les expériences et les modèles tout en gardant une trace des modifications.
  • Orchestrer les sous-processus d’un pipeline ML (préparation des données, entraînement du modèle, et prédictions).
  • Implémenter des pratiques MLOps pour une livraison continue, afin de déployer votre modèle de manière régulière, automatique et fiable.
  • Surveiller les applications ML en production pour s’assurer qu’elles fonctionnent correctement ou qu’elles nécessitent des ajustements.

Outils utilisés dans les exercices pratiques :

  • DVC, MLflow, Dagster, FastAPI, ONNX
  • Airflow, Kubeflow, et d’autres outils populaires des principaux fournisseurs de cloud.

Exigences techniques :

  • Docker & Docker-Compose (dernière version), avec des droits d’administrateur sur l’ordinateur.
  • Les images Docker et les instructions de configuration seront fournies avant l’atelier. Il est nécessaire de les installer avant la session.

Mardi 1er avril et mercredi 2 avril 2025
de 9h à 16h30, pauses comprises

Voici le programme détaillé de l’atelier MLOps, qui couvre les aspects essentiels de la gestion des projets de machine learning tout au long de leur cycle de vie, de la gestion des données à la surveillance en passant par le déploiement et le suivi des expériences :

1. MLOps – Qu’est-ce que c’est et pourquoi c’est essentiel

  • Quand les projets de machine learning deviennent sérieux : Défis spécifiques au ML et pourquoi MLOps est crucial pour leur succès.
  • Connaissance du domaine et défis : La nécessité de comprendre le domaine d’application du ML pour réussir.
  • Le cycle MLOps en un coup d’œil : Aperçu des étapes clés de MLOps.
  • MLOps vs. DevOps : Différences essentielles entre MLOps et DevOps.
  • Les niveaux de maturité MLOps : Les différentes étapes d’évolution des processus MLOps.

2. Versionnement des données et suivi des expériences

  • Bases et avantages du versioning de code et de données : Pourquoi versionner les données et les expériences dans un projet ML.
  • Introduction au DVC : Outil de versioning pour les données et suivi des expériences.
  • Exercices pratiques :
    • Gestion de versions de données avec DVC.
    • Suivi d’expériences avec DVC.

3. Orchestration du pipeline de données

  • Bases et avantages des pipelines de données : Comprendre l’importance de l’orchestration dans les projets ML.
  • Introduction à Dagster : Présentation de cet outil pour l’orchestration des pipelines.
  • Exercices pratiques :
    • Travaux d’actifs avec Dagster.
    • Tâches opérationnelles avec Dagster.

4. Suivi des expériences

  • Paramètres, métriques et artefacts : Les éléments à suivre pour évaluer la performance d’un modèle.
  • Bases et avantages du suivi des expériences : Importance du suivi pour la reproductibilité et l’amélioration continue.
  • Suivi des expériences avec MLflow : Utilisation de cet outil pour gérer les expériences.
  • Exercices pratiques :
    • Suivi des expériences avec MLflow.
    • Gestion des modèles avec MLflow.

5. CI/CD pour l’apprentissage automatique

  • Introduction à CI/CD pour ML : Comment adapter CI/CD au développement de modèles de machine learning.
  • Différences avec le CI/CD traditionnel : Ce qui peut être testé dans un pipeline ML.
  • Variantes de CI/CD pour les produits ML : Types de pipelines adaptés aux projets de ML.
  • Démonstration : Utilisation des actions Github et CML pour l’intégration et le déploiement continus.

6. Déploiement et service

  • Bases du déploiement du machine learning : Introduction aux principes du déploiement de modèles ML.
  • Inférence par lots vs inférence en direct : Différences entre ces deux approches.
  • Prétraitement des données pendant le déploiement : Comment gérer les données au moment du déploiement.
  • Introduction à ONNX : Format de modèle pour l’interopérabilité entre différents frameworks.
  • Exercice pratique : Utilisation de FastAPI et ONNX pour déployer un modèle.

7. Surveillance des modèles ML

  • Surveillance des modèles en production : Pourquoi et comment surveiller les performances des modèles après leur déploiement.
  • Données, métriques, et KPI : Les indicateurs clés de performance à suivre.
  • Démonstration : Surveillance avec l’outil évidemment.ai.

8. MLOps dans le cloud

  • Quand les solutions cloud sont-elles recommandées ? Comprendre les avantages des solutions cloud pour MLOps.
  • Comparaison des plateformes cloud : Amazon Sagemaker, Azure ML Studio et Google Vertex AI.
  • Démonstration : Formation de modèles avec Azure ML Studio.

9. Plateformes d’apprentissage automatique

  • Comment faire évoluer les équipes ML ? Gérer l’évolutivité dans les projets ML.
  • Les magasins de fonctionnalités : Définition et utilisation pour améliorer les performances des modèles.

10. LLMOps – Spécificités des modèles de langage

  • Différences entre MLOps et LLMOps : Spécificités des modèles de langage.
  • Démonstration : Utilisation de l’outil entrepriseGPT pour les modèles de langage.

Cet atelier vous fournira une compréhension approfondie de l’ensemble du cycle de vie d’un projet ML, de la gestion des données à la mise en production et la surveillance, tout en utilisant des outils et des techniques adaptés aux environnements modernes de machine learning.

Le séminaire est conçu pour les participants ayant déjà abordé la science des données et cherchant à améliorer l’efficacité de leur travail sur des projets ML. Bien que des connaissances en Python soient recommandées, elles ne sont pas indispensables, à condition d’avoir une compréhension de base des concepts de la science des données et des pipelines de machine learning.


Cela clarifie que bien que la connaissance de Python soit utile, ce n’est pas une exigence absolue, ce qui permet à un plus large éventail de participants de suivre le séminaire.

La participation comprend des documents détaillés.

Prix :
Les frais de participation sont de :
ACA0,00 € (hors TVA)

Shopping Basket