Búsqueda del mejor modelo de clasificación con aprendizaje automático automatizado

Determinar el algoritmo correcto y las transformaciones de preprocesamiento para el entrenamiento del modelo puede implicar una gran cantidad de suposiciones y experimentación.

En este ejercicio, usará el aprendizaje automático automatizado para determinar el algoritmo óptimo y los pasos de preprocesamiento para un modelo mediante varias ejecuciones de entrenamiento en paralelo.

Antes de empezar

Necesitará una suscripción de Azure en la que tenga acceso de nivel administrativo.

Aprovisionar un área de trabajo de Azure Machine Learning

Un área de trabajo de Azure Machine Learning proporciona un lugar central para administrar todos los recursos y recursos que necesita para entrenar y administrar los modelos. Puede interactuar con el área de trabajo de Azure Machine Learning a través de Studio, el SDK de Python y la CLI de Azure.

Usará la CLI de Azure para aprovisionar el área de trabajo y el proceso necesario, y usará el SDK de Python para entrenar un modelo de clasificación con aprendizaje automático automatizado.

Creación del área de trabajo y los recursos de proceso

Para crear el área de trabajo de Azure Machine Learning, una instancia de proceso y un clúster de proceso, usará la CLI de Azure. Todos los comandos necesarios se agrupan en un script de Shell para que se ejecute.

  1. En un explorador, abra el portal Azure en https://portal.azure.com/, iniciando sesión con su cuenta Microsoft.
  2. Seleccione el botón [>_] (Cloud Shell) en la parte superior de la página, a la derecha del cuadro de búsqueda. Se abre un panel de Cloud Shell en la parte inferior del portal.
  3. Seleccione Bash si se le pregunta. La primera vez que abra el shell de la nube, se le pedirá que elija el tipo de shell que desea utilizar (Bash o PowerShell).
  4. Comprueba que se ha especificado la suscripción correcta y que se ha seleccionado No se requiere ninguna cuenta de almacenamiento. Seleccione Aplicar.
  5. En el terminal, escriba los siguientes comandos para clonar este repositorio:

     rm -r azure-ml-labs -f
     git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
    

    Use SHIFT + INSERT para pegar el código copiado en Cloud Shell.

  6. Una vez clonado el repositorio, escriba los siguientes comandos para cambiar a la carpeta de este laboratorio y ejecute el script setup.sh que contiene:

     cd azure-ml-labs/Labs/06
     ./setup.sh
    

    Omita los mensajes (error) que digan que las extensiones no se instalaron.

  7. Espere a que se complete el script: normalmente tarda entre 5 y 10 minutos.

    Sugerencia para solucionar problemas: error de creación del área de trabajo

    Si recibes un error al ejecutar el script de instalación a través de la CLI, debes aprovisionar los recursos manualmente:

    1. En la página principal de Azure Portal, selecciona +Crear un recurso.
    2. Busca aprendizaje automático y, después, selecciona Azure Machine Learning. Seleccione Crear.
    3. Cree un recurso de Azure Machine Learning con la siguiente configuración:
      • Suscripción: suscripción de Azure
      • Grupo de recursos: rg-dp100-labs
      • Nombre del área de trabajo: mlw-dp100-labs
      • Región: seleccione la región geográfica más cercana.
      • Cuenta de almacenamiento: tenga en cuenta la nueva cuenta de almacenamiento predeterminada que se creará para el área de trabajo.
      • Almacén de claves: tenga en cuenta el nuevo almacén de claves predeterminado que se creará para el área de trabajo.
      • Application Insights: tenga en cuenta el nuevo recurso de Application Insights predeterminado que se creará para el área de trabajo.
      • Registro de contenedor: ninguno (se creará uno automáticamente la primera vez que implemente un modelo en un contenedor).
    4. Selecciona Revisar y crear y espera a que se cree el área de trabajo y sus recursos asociados: normalmente tarda unos 5 minutos.
    5. Selecciona Ir al recurso y en su página Información general, selecciona Iniciar Studio. Se abrirá otra pestaña en el explorador para abrir el Estudio de Azure Machine Learning.
    6. Cierre los elementos emergentes que aparecen en Studio.
    7. En el Estudio de Azure Machine Learning, ve a la página Proceso y selecciona +Nuevo en la pestaña Instancias de proceso.
    8. Asigna un nombre único a la instancia de proceso y, a continuación, selecciona Standard_DS11_v2 como tamaño de máquina virtual.
    9. Seleccione Revisar y crear y luego Crear.
    10. A continuación, selecciona la pestaña Clústeres de proceso y selecciona + Nuevo.
    11. Elige la misma región en la que creaste el área de trabajo y, a continuación, selecciona Standard_DS11_v2 como tamaño de máquina virtual. Seleccione Siguiente.
    12. Asigna al clúster un nombre único y, a continuación, selecciona Crear.
    13. </ol> </details>

Clonación de los materiales de laboratorio

Cuando haya creado el área de trabajo y los recursos de proceso necesarios, puede abrir el Estudio de Azure Machine Learning y clonar los materiales del laboratorio en el área de trabajo.

  1. En el Azure Portal, vaya al área de trabajo de Azure Machine Learning denominada mlw-dp100-… .
  2. Seleccione el área de trabajo de Azure Machine Learning y, en su página Información general, seleccione Iniciar Studio. Se abrirá otra pestaña en el explorador para abrir el Estudio de Azure Machine Learning.
  3. Cierre los elementos emergentes que aparecen en Studio.
  4. En el Estudio de Azure Machine Learning, vaya a la página Proceso y compruebe que la instancia de proceso y el clúster que creó en la sección anterior existen. La instancia de proceso debe estar en ejecución, el clúster debe estar inactivo y tener 0 nodos en ejecución.
  5. En la pestaña Instancias de proceso, busque la instancia de proceso y seleccione la aplicación Terminal.
  6. En el terminal, instale el SDK de Python en la instancia de proceso mediante la ejecución de los siguientes comandos en el terminal:

     pip uninstall azure-ai-ml
     pip install azure-ai-ml
    

    Omita los mensajes (error) que indiquen que no se han encontrado ni desinstalado los paquetes.

  7. Ejecute el siguiente comando para clonar un repositorio de Git que contenga cuadernos, datos y otros archivos en su área de trabajo:

     git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
    
  8. Una vez completado el comando, en el panel Archivos, haga clic en para actualizar la vista y compruebe que se ha creado la carpeta /Users/su-nombre-de-usuario/azure-ml-labs.

Entrenar un modelo de clasificación con aprendizaje automático automatizado

Ahora que tiene todos los recursos necesarios, puede ejecutar el cuaderno para configurar y enviar el trabajo de aprendizaje automático automatizado.

  1. Abra el cuaderno Labs/06/Classification con Automated Machine Learning.ipynb .

    Seleccione Autenticar y siga los pasos necesarios si aparece una notificación en la que se le pide que se autentique.

  2. Comprueba que el cuaderno usa el kernel de Python 3.10- AzureML.
  3. Ejecute todas las celdas del cuaderno.

    Se creará un nuevo trabajo en el área de trabajo de Azure Machine Learning. El trabajo realiza un seguimiento de las entradas definidas en la configuración del trabajo, el activo de datos utilizado y las salidas como métricas para evaluar los modelos.

    Tenga en cuenta que los trabajos de aprendizaje automático automatizado contienen trabajos secundarios, que representan modelos individuales entrenados y otras tareas necesarias para ejecutarse.

  4. Vaya a Trabajos y seleccione el experimento auto-ml-class-dev.
  5. Seleccione el trabajo en la columna Nombre para mostrar.
  6. Espere a que su estado cambie a Completado.
  7. Una vez que el estado del trabajo de Machine Learning automatizado haya cambiado a Completado, explore los detalles del trabajo en Studio:
    • En la pestaña Límites de protección de datos se muestra si los datos de entrenamiento tuvieron algún problema.
    • La pestaña Modelos + trabajos secundarios mostrará todos los modelos que se han entrenado. Selecciona Explicar modelo para obtener el mejor modelo y crea la ejecución del trabajo de explicación mediante aml-cluster.
    • Espera a que aparezca una nueva columna Explicado junto a la columna Nombre del algoritmo y selecciona Ver explicación. Es posible que tengas que actualizar la lista de algoritmos para que aparezca esta opción.
    • Revisa el panel creado para comprender qué características han influido más en el valor de destino.

Eliminación de recursos de Azure

Cuando termine de explorar Azure Machine Learning, debe eliminar los recursos que ha creado para evitar costos innecesarios de Azure.

  1. Cierre la pestaña Estudio de Azure Machine Learning y vuelva al Azure Portal.
  2. En Azure Portal, en la página Inicio, seleccione Grupos de recursos.
  3. Seleccione el grupo de recursos rg-dp100-… .
  4. En la parte superior de la página Información general del grupo de recursos, seleccione Eliminar grupo de recursos.
  5. Escribe el nombre del grupo de recursos para confirmar que quieres eliminarlo y selecciona Eliminar.