Suivre l’entraînement des modèles dans des notebooks avec MLflow
Souvent, vous démarrerez un nouveau projet de science des données en expérimentant et en entraînant plusieurs modèles. Pour suivre votre travail et garder une vue d’ensemble des modèles que vous entraînez et de leur fonctionnement, vous pouvez utiliser MLflow Tracking.
Dans cet exercice, vous allez utiliser MLflow dans un notebook s’exécutant sur une instance de calcul pour journaliser l’entraînement des modèles.
Avant de commencer
Vous avez besoin d’un abonnement Azure dans lequel vous avez un accès administratif.
Provisionner un espace de travail Azure Machine Learning
Un espace de travail Azure Machine Learning offre un emplacement central pour gérer toutes les ressources et tous les éléments dont vous avez besoin pour entraîner et gérer vos modèles. Vous pouvez interagir avec l’espace de travail Azure Machine Learning via le studio, le SDK Python et Azure CLI.
Vous allez utiliser Azure CLI pour provisionner l’espace de travail et les ressources de calcul nécessaires, puis utiliser le SDK Python pour entraîner un modèle de classification avec le Machine Learning automatisé.
Créer l’espace de travail et les ressources de calcul
Pour créer l’espace de travail Azure Machine Learning et une instance de calcul, vous utilisez Azure CLI. Toutes les commandes nécessaires sont regroupées dans un script Shell exécutable.
- Dans un navigateur, ouvrez le portail Azure sur
https://portal.azure.com/
en vous connectant avec votre compte Microsoft. - Sélectionnez le bouton [>_] (Cloud Shell) en haut de la page, à droite de la zone de recherche. Cela a pour effet d’ouvrir un volet de Cloud Shell au bas du portail.
- Sélectionnez Bash si vous y êtes invité. Lorsque vous ouvrez Cloud Shell pour la première fois, vous êtes invité à choisir le type d’interpréteur de commandes que vous souhaitez utiliser (Bash ou PowerShell).
- Vérifiez que le bon abonnement est spécifié et que l’option Aucun compte de stockage requis est sélectionnée. Sélectionnez Appliquer.
-
Dans le terminal, entrez les commandes suivantes pour cloner ce dépôt :
rm -r azure-ml-labs -f git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
Utilisez
SHIFT + INSERT
pour coller votre code copié dans Cloud Shell. -
Une fois que le dépôt a été cloné, entrez les commandes suivantes pour accéder au dossier de ce labo et exécutez le script setup.sh qu’il contient :
cd azure-ml-labs/Labs/07 ./setup.sh
Ignorez les messages (d’erreur) indiquant que les extensions n’ont pas été installées.
- Attendez que le script se termine, ce qui prend généralement entre 5 et 10 minutes.
Cloner les supports de labo
Une fois que vous avez créé l’espace de travail et les ressources de calcul nécessaires, vous pouvez ouvrir le studio Azure Machine Learning et cloner les supports de labo dans l’espace de travail.
- Dans le portail Azure, accédez à l’espace de travail Azure Machine Learning appelé mlw-dp100-….
- Sélectionnez l’espace de travail Azure Machine Learning et, dans sa page Vue d’ensemble, sélectionnez Lancer le studio. Un autre onglet s’ouvre dans votre navigateur pour ouvrir le studio Azure Machine Learning.
- Fermez les fenêtres contextuelles qui s’affichent dans le studio.
- Dans Azure Machine Learning studio, accédez à la page Calcul et vérifiez que l’instance de calcul créée dans la section précédente existe. L’instance de calcul doit être en cours d’exécution.
- Sous l’onglet Instances de calcul, recherchez votre instance de calcul et sélectionnez l’application Terminal.
-
Dans le terminal, installez le kit de développement logiciel (SDK) Python et la bibliothèque MLflow sur l’instance de calcul en exécutant les commandes suivantes :
pip uninstall azure-ai-ml pip install azure-ai-ml pip install mlflow
Ignorez les messages (d’erreur) indiquant que les packages n’ont pas pu être trouvés et désinstallés.
-
Exécutez la commande suivante pour cloner un dépôt Git contenant un notebook, des données et autres fichiers dans votre espace de travail :
git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
- Une fois la commande exécutée, dans le volet Fichiers, cliquez sur ↻ pour actualiser la vue et vérifier qu’un dossier Users/votre-nom-utilisateur/azure-ml-labs a été créé.
Suivre l’entraînement des modèles avec MLflow
Maintenant que vous disposez de toutes les ressources nécessaires, vous pouvez exécuter le notebook pour configurer et utiliser MLflow dans le cadre de l’entraînement de modèles dans un notebook.
-
Ouvrez le notebook Labs/07/Track model training with MLflow.ipynb.
Sélectionnez S’authentifier et suivez les étapes à faire si une notification vous invite à vous authentifier.
- Vérifiez que le notebook utilise le noyau Python 3.8 - AzureML.
- Exécutez toutes les cellules dans le notebook.
-
Examinez le nouveau travail qui est créé à chaque entraînement d’un modèle.
Remarque : lorsque vous entraînez un modèle, la sortie de la cellule affiche un lien vers l’exécution du travail. Si le lien retourne une erreur, vous pouvez toujours passer en revue l’exécution du travail en sélectionnant Travaux dans le volet gauche.
Supprimer les ressources Azure
Une fois que vous avez fini d’explorer Azure Machine Learning, vous devriez supprimer les ressources que vous avez créées afin d’éviter des coûts Azure superflus.
- Fermez l’onglet du studio Azure Machine Learning et revenez au portail Azure.
- Dans le portail Azure, dans la page Accueil, sélectionnez Groupes de ressources.
- Sélectionnez le groupe de ressources rg-dp100-….
- Au sommet de la page Vue d’ensemble de votre groupe de ressources, sélectionnez Supprimer le groupe de ressources.
- Entrez le nom du groupe de ressources pour confirmer que vous souhaitez le supprimer, puis sélectionnez Supprimer.