Búsqueda del mejor modelo de clasificación con aprendizaje automático automatizado

Determinar el algoritmo correcto y las transformaciones de preprocesamiento para el entrenamiento del modelo puede implicar una gran cantidad de suposiciones y experimentación.

En este ejercicio, usará el aprendizaje automático automatizado para determinar el algoritmo óptimo y los pasos de preprocesamiento para un modelo mediante varias ejecuciones de entrenamiento en paralelo.

Antes de empezar

Necesitará una suscripción de Azure en la que tenga acceso de nivel administrativo.

Aprovisionar un área de trabajo de Azure Machine Learning

Un área de trabajo de Azure Machine Learning proporciona un lugar central para administrar todos los recursos y recursos que necesita para entrenar y administrar los modelos. Puede interactuar con el área de trabajo de Azure Machine Learning a través de Studio, el SDK de Python y la CLI de Azure.

Usará la CLI de Azure para aprovisionar el área de trabajo y el proceso necesario, y usará el SDK de Python para entrenar un modelo de clasificación con aprendizaje automático automatizado.

Creación del área de trabajo y los recursos de proceso

Para crear el área de trabajo de Azure Machine Learning, una instancia de proceso y un clúster de proceso, usará la CLI de Azure. Todos los comandos necesarios se agrupan en un script de Shell para que se ejecute.

  1. En un explorador, abra el portal Azure en https://portal.azure.com/, iniciando sesión con su cuenta Microsoft.
  2. Seleccione el botón [>_] (Cloud Shell) en la parte superior de la página, a la derecha del cuadro de búsqueda. Se abre un panel de Cloud Shell en la parte inferior del portal.
  3. Seleccione Bash si se le pregunta. La primera vez que abra el shell de la nube, se le pedirá que elija el tipo de shell que desea utilizar (Bash o PowerShell).
  4. Comprueba que se ha especificado la suscripción correcta y que se ha seleccionado No se requiere ninguna cuenta de almacenamiento. Seleccione Aplicar.
  5. En el terminal, escriba los siguientes comandos para clonar este repositorio:

     rm -r azure-ml-labs -f
     git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
    

    Use SHIFT + INSERT para pegar el código copiado en Cloud Shell.

  6. Una vez clonado el repositorio, escriba los siguientes comandos para cambiar a la carpeta de este laboratorio y ejecute el script setup.sh que contiene:

     cd azure-ml-labs/Labs/06
     ./setup.sh
    

    Omita los mensajes (error) que digan que las extensiones no se instalaron.

  7. Espere a que se complete el script: normalmente tarda entre 5 y 10 minutos.

Clonación de los materiales de laboratorio

Cuando haya creado el área de trabajo y los recursos de proceso necesarios, puede abrir el Estudio de Azure Machine Learning y clonar los materiales del laboratorio en el área de trabajo.

  1. En el Azure Portal, vaya al área de trabajo de Azure Machine Learning denominada mlw-dp100-… .
  2. Seleccione el área de trabajo de Azure Machine Learning y, en su página Información general, seleccione Iniciar Studio. Se abrirá otra pestaña en el explorador para abrir el Estudio de Azure Machine Learning.
  3. Cierre los elementos emergentes que aparecen en Studio.
  4. En el Estudio de Azure Machine Learning, vaya a la página Proceso y compruebe que la instancia de proceso y el clúster que creó en la sección anterior existen. La instancia de proceso debe estar en ejecución, el clúster debe estar inactivo y tener 0 nodos en ejecución.
  5. En la pestaña Instancias de proceso, busque la instancia de proceso y seleccione la aplicación Terminal.
  6. En el terminal, instale el SDK de Python en la instancia de proceso mediante la ejecución de los siguientes comandos en el terminal:

     pip uninstall azure-ai-ml
     pip install azure-ai-ml
    

    Omita los mensajes (error) que indiquen que no se han encontrado ni desinstalado los paquetes.

  7. Ejecute el siguiente comando para clonar un repositorio de Git que contenga cuadernos, datos y otros archivos en su área de trabajo:

     git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
    
  8. Una vez completado el comando, en el panel Archivos, haga clic en para actualizar la vista y compruebe que se ha creado la carpeta /Users/su-nombre-de-usuario/azure-ml-labs.

Entrenar un modelo de clasificación con aprendizaje automático automatizado

Ahora que tiene todos los recursos necesarios, puede ejecutar el cuaderno para configurar y enviar el trabajo de aprendizaje automático automatizado.

  1. Abra el cuaderno Labs/06/Classification con Automated Machine Learning.ipynb .

    Seleccione Autenticar y siga los pasos necesarios si aparece una notificación en la que se le pide que se autentique.

  2. Compruebe que el cuaderno usa el kernel de Python 3.8- AzureML.
  3. Ejecute todas las celdas del cuaderno.

    Se creará un nuevo trabajo en el área de trabajo de Azure Machine Learning. El trabajo realiza un seguimiento de las entradas definidas en la configuración del trabajo, el activo de datos utilizado y las salidas como métricas para evaluar los modelos.

    Tenga en cuenta que los trabajos de aprendizaje automático automatizado contienen trabajos secundarios, que representan modelos individuales entrenados y otras tareas necesarias para ejecutarse.

  4. Vaya a Trabajos y seleccione el experimento auto-ml-class-dev.
  5. Seleccione el trabajo en la columna Nombre para mostrar.
  6. Espere a que su estado cambie a Completado.
  7. Una vez que el estado del trabajo de Machine Learning automatizado haya cambiado a Completado, explore los detalles del trabajo en Studio:
    • En la pestaña Límites de protección de datos se muestra si los datos de entrenamiento tuvieron algún problema.
    • La pestaña Modelos + trabajos secundarios mostrará todos los modelos que se han entrenado. Selecciona Explicar modelo para obtener el mejor modelo y crea la ejecución del trabajo de explicación mediante aml-cluster.
    • Espera a que aparezca una nueva columna Explicado junto a la columna Nombre del algoritmo y selecciona Ver explicación. Es posible que tengas que actualizar la lista de algoritmos para que aparezca esta opción.
    • Revisa el panel creado para comprender qué características han influido más en el valor de destino.

Eliminación de recursos de Azure

Cuando termine de explorar Azure Machine Learning, debe eliminar los recursos que ha creado para evitar costos innecesarios de Azure.

  1. Cierre la pestaña Estudio de Azure Machine Learning y vuelva al Azure Portal.
  2. En Azure Portal, en la página Inicio, seleccione Grupos de recursos.
  3. Seleccione el grupo de recursos rg-dp100-… .
  4. En la parte superior de la página Información general del grupo de recursos, seleccione Eliminar grupo de recursos.
  5. Escribe el nombre del grupo de recursos para confirmar que quieres eliminarlo y selecciona Eliminar.