Trabajo con recursos de proceso en Azure Machine Learning

Una de las principales ventajas de la nube es la posibilidad de usar recursos de proceso escalables y a petición para el procesamiento rentable de datos de gran tamaño.

En este ejercicio, aprenderá a utilizar el proceso en la nube en Azure Machine Learning para ejecutar experimentos y código de producción a escala.

Antes de empezar

Necesitará una suscripción de Azure en la que tenga acceso de nivel administrativo.

Aprovisionar un área de trabajo de Azure Machine Learning

Un área de trabajo de Azure Machine Learning proporciona un lugar central para administrar todos los recursos y recursos que necesita para entrenar y administrar los modelos. Puede interactuar con el área de trabajo de Azure Machine Learning a través de Studio, el SDK de Python y la CLI de Azure.

Para crear el área de trabajo de Azure Machine Learning, usará la CLI de Azure. Todos los comandos necesarios se agrupan en un script de Shell para que se ejecute.

  1. En un explorador, abra el portal Azure en https://portal.azure.com/, iniciando sesión con su cuenta Microsoft.
  2. Seleccione el botón [>_] (Cloud Shell) en la parte superior de la página, a la derecha del cuadro de búsqueda. Se abre un panel de Cloud Shell en la parte inferior del portal.
  3. Seleccione Bash si se le pregunta. La primera vez que abra el shell de la nube, se le pedirá que elija el tipo de shell que desea utilizar (Bash o PowerShell).
  4. Comprueba que se ha especificado la suscripción correcta y que se ha seleccionado No se requiere ninguna cuenta de almacenamiento. Seleccione Aplicar.
  5. Para evitar cualquier conflicto con versiones anteriores, elimine cualquier extensión CLI de ML (tanto de la versión 1 como de la 2) ejecutando este comando en el terminal:

     az extension remove -n azure-cli-ml
     az extension remove -n ml
    

    Use SHIFT + INSERT para pegar el código copiado en Cloud Shell.

    Omita los mensajes (error) que digan que las extensiones no se instalaron.

  6. Instale la extensión Azure Machine Learning (v2) con el siguiente comando:

     az extension add -n ml -y
    
  7. Cree un grupo de recursos. Elija una ubicación cercana a usted.

     az group create --name "rg-dp100-labs" --location "eastus"
    
  8. Creación de un área de trabajo:

     az ml workspace create --name "mlw-dp100-labs" -g "rg-dp100-labs"
    
  9. Espere a que se complete el comando: normalmente tarda entre 5 y 10 minutos.

Creación del script de configuración del cálculo

Para ejecutar cuadernos en el área de trabajo de Azure Machine Learning, necesitará una instancia de proceso. Puede usar un script de instalación para configurar la instancia de proceso al crearla.

  1. En el Azure Portal, vaya al área de trabajo de Azure Machine Learning denominada mlw-dp100-labs.
  2. Seleccione el área de trabajo de Azure Machine Learning y, en su página Información general, seleccione Iniciar Studio. Se abrirá otra pestaña en el explorador para abrir el Estudio de Azure Machine Learning.
  3. Cierre los elementos emergentes que aparecen en Studio.
  4. En el Estudio de Azure Machine Learning, vaya a la página Cuadernos.
  5. En el panel Archivos, seleccione el icono ⨁ para Agregar archivos.
  6. Seleccione Create new file (Crear archivo).
  7. Compruebe que la ubicación del archivo sea Users/* your-user-name*.
  8. Cambie el tipo de archivo a Bash (*.sh) .
  9. Cambie el nombre del archivo a compute-setup.sh.
  10. Abra el archivo compute-setup.sh recién creado y pegue lo siguiente en su contenido:

     #!/bin/bash
    
     # clone repository
     git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
    
  11. Guarde el archivo compute-setup.sh.

Creación de la instancia de proceso

Para crear la instancia de proceso, puede usar Studio, el SDK de Python o la CLI de Azure. Usará Studio para crear la instancia de proceso con el script de instalación que acaba de crear.

  1. Vaya a la página Proceso con el menú de la izquierda.
  2. En la pestaña Instancias de proceso, seleccione Nuevo.
  3. Configure (aún no cree) la instancia de proceso con las siguientes opciones:
    • Nombre del proceso: escriba un nombre único
    • Tipo de máquina virtual: CPU
    • Tamaño de máquina virtual: Standard_DS11_v2
  4. Seleccione Siguiente.
  5. Seleccione Agregar programación y configure la programación para detener la instancia de proceso todos los días a las 18:00 o 6:00 p.m.
  6. Seleccione Siguiente.
  7. Revise la configuración de seguridad, pero no las seleccione:
    • Habilitar acceso SSH: se puede usar para habilitar el acceso directo a la máquina virtual mediante un cliente SSH.
    • Habilitar red virtual: normalmente se usaría en un entorno empresarial para mejorar la seguridad de la red.
    • Asignar a otro usuario: puede utilizarlo para asignar una instancia de cálculo a otro científico de datos.
  8. Seleccione Siguiente.
  9. Seleccione el botón de alternancia para Aprovisionamiento con un script de creación.
  10. Seleccione el script compute-setup.sh que creó anteriormente.
  11. Seleccione Revisar y crear para crear la instancia de proceso y esperar a que se inicie y su estado cambie a En ejecución.
  12. Cuando se ejecute la instancia de proceso, vaya a la página Cuadernos. En el panel Archivos, haga clic en para actualizar la vista y comprobar que se ha creado una nueva carpeta Users/your-user-name/dp100-azure-ml-labs.

Configuración de la instancia de proceso

Cuando haya creado la instancia de proceso, puede ejecutar cuadernos en ella. Es posible que tenga que instalar determinados paquetes para ejecutar el código que desee. Puede incluir paquetes en el script de instalación o instalarlos mediante el terminal.

  1. En la pestaña Instancias de proceso, busque la instancia de proceso y seleccione la aplicación Terminal.
  2. En el terminal, instale el SDK de Python en la instancia de proceso mediante la ejecución de los siguientes comandos en el terminal:

     pip uninstall azure-ai-ml
     pip install azure-ai-ml
    

    Omita los mensajes (error) que indiquen que los paquetes no se instalaron.

  3. Cuando se instalan los paquetes, puede cerrar la pestaña para finalizar el terminal.

Creación de un clúster de proceso

Los cuadernos son ideales para el desarrollo o el trabajo iterativo durante la experimentación. Al experimentar, querrá ejecutar cuadernos en una instancia de proceso para probar y revisar código rápidamente. Al pasar a producción, querrá ejecutar scripts en un clúster de proceso. Creará un clúster de proceso con el SDK de Python y lo usará para ejecutar un script como trabajo.

  1. Abra el cuaderno Labs/04/Work with compute.ipynb.

    Seleccione Autenticar y siga los pasos necesarios si aparece una notificación en la que se le pide que se autentique.

  2. Compruebe que el cuaderno usa el kernel de Python 3.8- AzureML.
  3. Ejecute todas las celdas del cuaderno.

Eliminación de recursos de Azure

Cuando termine de explorar Azure Machine Learning, debe eliminar los recursos que ha creado para evitar costos innecesarios de Azure.

  1. Cierre la pestaña Estudio de Azure Machine Learning y vuelva al Azure Portal.
  2. En Azure Portal, en la página Inicio, seleccione Grupos de recursos.
  3. Seleccione el grupo de recursos rg-dp100-labs.
  4. En la parte superior de la página Información general del grupo de recursos, seleccione Eliminar grupo de recursos.
  5. Escribe el nombre del grupo de recursos para confirmar que quieres eliminarlo y selecciona Eliminar.