Generación de imágenes con el modelo DALL-E

Azure OpenAI Service incluye un modelo de generación de imágenes denominado DALL-E. Puede usar este modelo para enviar mensajes en lenguaje natural que describan una imagen deseada y el modelo generará una imagen original basada en la descripción que proporcione.

En este ejercicio, usará un modelo DALL-E versión 3 para generar imágenes basadas en avisos de lenguaje natural.

Este ejercicio dura aproximadamente 25 minutos.

Aprovisionamiento de un recurso de Azure OpenAI

Para poder usar Azure OpenAI para generar imágenes, debe aprovisionar un recurso de Azure OpenAI en su suscripción de Azure. El recurso debe estar en una región donde se admiten los modelos DALL-E.

Inicie sesión en Azure Portal en https://portal.azure.com.
Cree un recurso de Azure OpenAI con la siguiente configuración:
- Suscripción: Seleccione una suscripción de Azure que se haya aprobado para acceder al servicio Azure OpenAI, incluido DALL-E
- Grupo de recursos: elija o cree un grupo de recursos
- Región: Este de EE. UU.** o **Centro de Suecia*
- Nombre: nombre único que prefiera
- Plan de tarifa: estándar S0
* Los modelos DALL-E 3 solo están disponibles en los recursos de Azure OpenAI Service en las regiones de Este de EE. UU. y Centro de Suecia.
Espere a que la implementación finalice. A continuación, vaya al recurso de Azure OpenAI implementado en Azure Portal.
En la página Información general del recurso de Azure OpenAI, desplázate hacia abajo hasta la sección Comenzar y selecciona el botón para ir al portal de Azure AI Foundry (anteriormente Estudio de IA).
En Portal de Azure AI Foundry, en el panel de la izquierda, selecciona la página Implementaciones y consulta las implementaciones de modelos existentes. Si aún no tienes una para DALL-E 3, crea una nueva implementación del modelo dall-e-3 con la siguiente configuración:
- Nombre de implementación: dalle3
- Versión del modelo: uso de la versión predeterminada
- Tipo de implementación: estándar
- Unidades de capacidad: 1000
- Filtro de contenido: valor predeterminado
- Habilitación de la cuota dinámica: deshabilitada
Tras la implementación, vuelve a la página Imágenes del panel izquierdo.

Exploración de la generación de imágenes en el área de juegos de Imágenes

Puedes usar el área de juegos de Imágenes en el portal de Azure AI Foundry para experimentar con la generación de imágenes.

En la sección Imágenes de Áreas de juegos, la implementación de DALL-E 3 debería haberse seleccionado automáticamente. En caso contrario, selecciónala en el elemento desplegable de la implementación.
En el cuadro Mensaje, escriba una descripción de una imagen que desee generar. Por ejemplo, An elephant on a skateboard A continuación, seleccione Generar y vea la imagen que se genera.
Modifique el mensaje para proporcionar una descripción más específica. Por ejemplo, An elephant on a skateboard in the style of Picasso. A continuación, genere la nueva imagen y revise los resultados.

Uso de la API REST para generar imágenes

Azure OpenAI Service proporciona una API REST que puede usar para enviar mensajes para la generación de contenido, incluidas imágenes generadas por el modelo DALL-E.

Preparación para desarrollar una aplicación en Visual Studio Code

Ahora vamos a explorar cómo crear una aplicación personalizada que use el servicio Azure OpenAI para generar imágenes. Desarrollará la aplicación con Visual Studio Code. Los archivos de código de la aplicación se han proporcionado en un repositorio de GitHub.

Sugerencia: Si ya ha clonado el repositorio mslearn-openai, ábralo en Visual Studio Code. De lo contrario, siga estos pasos para clonarlo en el entorno de desarrollo.

Inicie Visual Studio Code.
Abra la paleta (Mayús + Ctrl + P) y ejecute un comando Git: Clone para clonar el repositorio https://github.com/MicrosoftLearning/mslearn-openai en una carpeta local (no importa qué carpeta).
Cuando se haya clonado el repositorio, abra la carpeta en Visual Studio Code.

Nota: Si Visual Studio Code muestra un mensaje emergente para solicitarle que confíe en el código que está abriendo, haga clic en la opción Sí, confío en los autores en el elemento emergente.
Espere mientras se instalan archivos adicionales para admitir los proyectos de código de C# en el repositorio.

Nota: Si se le pide que agregue los recursos necesarios para compilar y depurar, seleccione Ahora no.

Configuración de la aplicación

Se han proporcionado aplicaciones para C# y Python. Las dos aplicaciones tienen la misma funcionalidad. En primer lugar, agregará el punto de conexión y la clave del recurso de Azure OpenAI al archivo de configuración de la aplicación.

En Visual Studio Code, en el panel Explorador, vaya a la carpeta Labfiles/05-image-generation y expanda la carpeta C-Sharp o Python según sus preferencias de lenguaje. Cada carpeta contiene los archivos específicos del lenguaje de una aplicación en la que va a integrar la funcionalidad de OpenAI de Azure.
En el panel Explorador, en la carpeta CSharp o Python, abra el archivo de configuración para su lenguaje preferido.
- C#: appsettings.json
- Python: .env
Actualice los valores de configuración para incluir el punto de conexión y la clave del recurso Azure OpenAI que ha creado (disponible en la página claves y punto de conexión de su recurso Azure OpenAI en el Azure Portal).
Guarde el archivo de configuración.

Visualización del código de la aplicación

Ya está listo para explorar el código que se usa para llamar a la API REST y generar una imagen.

En el panel Explorador, seleccione el archivo de código principal de la aplicación:
- C#: Program.cs
- Python: generate-image.py
Revise el código que contiene el archivo y observe las siguientes características clave:
- El código realiza una solicitud https al punto de conexión del servicio, incluida la clave del servicio en el encabezado. Estos dos valores se obtienen del archivo de configuración.
- La solicitud incluye algunos parámetros, como la indicación en la que debe basarse la imagen, el número de imágenes que se van a generar y el tamaño de las imágenes generadas.
- La respuesta incluye una solicitud revisada que el modelo DALL-E extrapola del mensaje proporcionado por el usuario para que sea más descriptivo y la dirección URL de la imagen generada.
Importante: Si puso a la implementación un nombre distinto del recomendado dalle3, deberás actualizar el código con el nombre de la implementación.

Ejecutar la aplicación

Ahora que ha revisado el código, es el momento de ejecutarlo y generar algunas imágenes.

Haga clic con el botón derecho en la carpeta CSharp o Python que contiene los archivos de código y abra un terminal integrado. A continuación, escriba el comando adecuado para ejecutar la aplicación:

C#
```
dotnet run
```
Python
```
pip install requests
python generate-image.py
```
Cuando se le pida, escriba la descripción de una imagen. Por ejemplo, A giraffe flying a kite.
Espere a que se genere la imagen: se mostrará un hipervínculo en el panel de terminal. Seleccione el hipervínculo para abrir una nueva pestaña del explorador y revise la imagen que se ha generado.

SUGERENCIA: Si la aplicación no devuelve una respuesta, espere un minuto e inténtelo de nuevo. Los recursos recién implementados pueden tardar hasta 5 minutos en estar disponibles.
Cierre la pestaña del explorador que contiene la imagen generada y vuelva a ejecutar la aplicación para generar una nueva imagen con un símbolo del sistema diferente.

Limpiar

Cuando haya terminado de usar el recurso de Azure OpenAI, recuerde eliminar el recurso en Azure Portal en https://portal.azure.com.