Trouver le meilleur modèle de classification avec le Machine Learning automatisé
La détermination de l’algorithme et des transformations de prétraitement appropriés pour l’apprentissage du modèle peut impliquer beaucoup de supputations et d’expérimentations.
Dans cet exercice, vous allez utiliser le Machine Learning automatisé pour déterminer l’algorithme et les étapes de prétraitement optimaux d’un modèle en effectuant plusieurs apprentissage en parallèle.
Avant de commencer
Vous avez besoin d’un abonnement Azure dans lequel vous avez un accès administratif.
Provisionner un espace de travail Azure Machine Learning
Un espace de travail Azure Machine Learning offre un emplacement central pour gérer toutes les ressources et tous les éléments dont vous avez besoin pour entraîner et gérer vos modèles. Vous pouvez interagir avec l’espace de travail Azure Machine Learning via le studio, le SDK Python et Azure CLI.
Vous allez utiliser Azure CLI pour provisionner l’espace de travail et les ressources de calcul nécessaires, puis utiliser le SDK Python pour entraîner un modèle de classification avec le Machine Learning automatisé.
Créer l’espace de travail et les ressources de calcul
Pour créer l’espace de travail Azure Machine Learning, une instance de calcul et un cluster de calcul, vous allez utiliser Azure CLI. Toutes les commandes nécessaires sont regroupées dans un script Shell que vous pouvez exécuter.
- Dans un navigateur, ouvrez le portail Azure sur
https://portal.azure.com/
en vous connectant avec votre compte Microsoft. - Sélectionnez le bouton [>_] (Cloud Shell) en haut de la page, à droite de la zone de recherche. Cela a pour effet d’ouvrir un volet de Cloud Shell au bas du portail.
- Sélectionnez Bash si vous y êtes invité. Lorsque vous ouvrez Cloud Shell pour la première fois, vous êtes invité à choisir le type d’interpréteur de commandes que vous souhaitez utiliser (Bash ou PowerShell).
- Vérifiez que le bon abonnement est spécifié et que l’option Aucun compte de stockage requis est sélectionnée. Sélectionnez Appliquer.
-
Dans le terminal, entrez les commandes suivantes pour cloner ce dépôt :
rm -r azure-ml-labs -f git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
Utilisez
SHIFT + INSERT
pour coller votre code copié dans Cloud Shell. -
Une fois que le dépôt a été cloné, entrez les commandes suivantes pour accéder au dossier de ce labo et exécutez le script setup.sh qu’il contient :
cd azure-ml-labs/Labs/06 ./setup.sh
Ignorez les messages (d’erreur) indiquant que les extensions n’ont pas été installées.
- Attendez que le script se termine, ce qui prend généralement entre 5 et 10 minutes.
Cloner les supports de labo
Une fois que vous avez créé l’espace de travail et les ressources de calcul nécessaires, vous pouvez ouvrir le studio Azure Machine Learning et cloner les supports de labo dans l’espace de travail.
- Dans le portail Azure, accédez à l’espace de travail Azure Machine Learning appelé mlw-dp100-….
- Sélectionnez l’espace de travail Azure Machine Learning et, dans sa page Vue d’ensemble, sélectionnez Lancer le studio. Un autre onglet s’ouvre dans votre navigateur pour ouvrir le studio Azure Machine Learning.
- Fermez les fenêtres contextuelles qui s’affichent dans le studio.
- Dans le studio Azure Machine Learning, accédez à la page Calcul et vérifiez que l’instance de calcul et le cluster que vous avez créés dans la section précédente existent. L’instance de calcul doit être en cours d’exécution, le cluster doit être inactif et avoir 0 nœud en cours d’exécution.
- Sous l’onglet Instances de calcul, recherchez votre instance de calcul et sélectionnez l’application Terminal.
-
Dans le terminal, installez le SDK Python sur l’instance de calcul en exécutant les commandes suivantes :
pip uninstall azure-ai-ml pip install azure-ai-ml
Ignorez les éventuels messages (d’erreur) indiquant que les packages n’ont pas pu être trouvés et désinstallés.
-
Exécutez la commande suivante pour cloner un dépôt Git contenant des notebooks, des données et autres fichiers dans votre espace de travail :
git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
- Une fois la commande exécutée, dans le volet Fichiers, cliquez sur ↻ pour actualiser l’affichage et vérifier qu’un nouveau dossier Users/votre-nom-utilisateur/azure-ml-labs a été créé.
Entraîner un modèle de classification avec le Machine Learning automatisé
Maintenant que vous disposez de toutes les ressources nécessaires, vous pouvez exécuter le notebook pour configurer et soumettre le travail du Machine Learning automatisé.
-
Ouvrez le notebook Labs/06/Classification with Automated Machine Learning.ipynb.
Sélectionnez S’authentifier et suivez les étapes nécessaires si une notification apparaît et vous invite à vous authentifier.
- Vérifiez que le notebook utilise le noyau Python 3.8 - AzureML.
-
Exécutez toutes les cellules dans le notebook.
Un nouveau travail est créé dans l’espace de travail Azure Machine Learning. Le travail suit les entrées définies dans la configuration de travail, la ressource de données utilisée et les sorties telles que les métriques pour évaluer les modèles.
Notez que les travaux du Machine Learning automatisé contiennent des travaux enfants, qui représentent des modèles individuels qui ont été entraînés et autres tâches nécessaires à l’exécution.
- Accédez à Travaux et sélectionnez l’expérience auto-ml-class-dev.
- Sélectionnez le travail sous la colonne Nom d’affichage.
- Attendez que son état passe à Terminé.
- Une fois que l’état du travail Machine Learning automatisé est passé à Terminé, explorez les détails du travail dans le studio :
- L’onglet Garde-fous des données montre si vos données d’entraînement ont rencontré des problèmes.
- L’onglet Modèles + travaux enfants montre tous les modèles qui ont été entraînés. Sélectionnez Expliquer le modèle pour le meilleur modèle et créez le travail d’explication exécuté à l’aide du aml-cluster.
- Attendez qu’une nouvelle colonne Expliqué s’affiche en regard de la colonne Nom de l’algorithme **et sélectionnez **Afficher l’explication. Vous devrez peut-être actualiser la liste d’algorithmes pour que cette option apparaisse.
- Passez en revue le tableau de bord créé pour comprendre quelles fonctionnalités ont le plus influencé la valeur cible.
Supprimer les ressources Azure
Une fois que vous avez fini d’explorer Azure Machine Learning, vous devriez supprimer les ressources que vous avez créées afin d’éviter des coûts Azure superflus.
- Fermez l’onglet du studio Azure Machine Learning et revenez au portail Azure.
- Dans le portail Azure, dans la page Accueil, sélectionnez Groupes de ressources.
- Sélectionnez le groupe de ressources rg-dp100-….
- Au sommet de la page Vue d’ensemble de votre groupe de ressources, sélectionnez Supprimer le groupe de ressources.
- Entrez le nom du groupe de ressources pour confirmer que vous souhaitez le supprimer, puis sélectionnez Supprimer.