Exploración del análisis en tiempo real en Microsoft Fabric
Microsoft Fabric proporciona inteligencia en tiempo real, lo que le permite crear soluciones analíticas para flujos de datos en tiempo real. En este ejercicio, usarás las funcionalidades de inteligencia en tiempo real de Microsoft Fabric para ingerir, analizar y visualizar un flujo de datos de una empresa de taxis en tiempo real.
Este laboratorio se realiza en unos 30 minutos.
Nota: Necesitas un inquilino de Microsoft Fabric para completar este ejercicio.
Creación de un área de trabajo
Antes de trabajar con datos de Fabric, necesitas crear un área de trabajo con la capacidad gratuita de Fabric habilitada.
- En un explorador, ve a la página principal de Microsoft Fabric en
https://app.fabric.microsoft.com/home?experience=fabric
e inicia sesión con tus credenciales de Fabric. - En la barra de menús de la izquierda, selecciona Áreas de trabajo (el icono tiene un aspecto similar a 🗇).
- Crea una nueva área de trabajo con el nombre que prefieras y selecciona un modo de licencia que incluya capacidad de Fabric (Evaluación gratuita, Premium o Fabric).
-
Cuando se abra la nueva área de trabajo, debe estar vacía.
Crear un Eventstream
Ahora estás listo para buscar e ingerir datos en tiempo real desde un origen de streaming. Para ello, se iniciará en el centro en tiempo real de Fabric.
Sugerencia: La primera vez que uses el centro en tiempo real, es posible que aparezcan algunas sugerencias de introducción. Puedes cerrarlas.
-
En la barra de menús de la izquierda, selecciona el centro en tiempo real.
El centro en tiempo real proporciona una manera fácil de buscar y administrar orígenes de datos de streaming.
- En el centro en tiempo real, en la sección Conectar a, selecciona Orígenes de datos.
-
Busca el origen de datos de ejemplo Yellow taxi y selecciona Conectar. Después, en el asistente Conectar, nombra el origen
taxi
y edita el nombre predeterminado del flujo de eventos para cambiarlo ataxi-data
. El flujo predeterminado asociado a estos datos se denominará automáticamente taxi-data-stream: -
Selecciona Siguiente y espera a que se creen el origen y el flujo de eventos, después selecciona Abrir flujo de eventos. El Eventstream mostrará el origen taxi y el taxi-data-stream en el lienzo de diseño:
Creación de instancia de Eventhouse
El flujo de eventos ingiere los datos de existencias en tiempo real, pero actualmente no hace nada con él. Vamos a crear un centro de eventos donde podamos almacenar los datos capturados en una tabla.
-
En la barra de menús de la izquierda, selecciona Crear. En la página Nuevo, en la sección Inteligencia en tiempo real, selecciona Eventhouse. Asígnale un nombre único que elijas.
Nota: si la opción Crear no está anclada a la barra lateral, primero debes seleccionar la opción de puntos suspensivos (…).
Cierra las sugerencias o avisos que se muestran hasta que veas tu nuevo centro de eventos vacío.
- En el panel de la izquierda, ten en cuenta que el centro de eventos contiene una base de datos KQL con el mismo nombre que el centro de eventos. Puedes crear tablas para los datos en tiempo real de esta base de datos o crear bases de datos adicionales según sea necesario.
-
Selecciona la base de datos y ten en cuenta que hay un conjunto de consultas asociado. Este archivo contiene algunas consultas KQL de ejemplo que puedes usar para empezar a consultar las tablas de la base de datos.
Sin embargo, actualmente no hay tablas que consultar. Vamos a resolver ese problema mediante la obtención de datos del flujo de eventos de una nueva tabla.
- En la página principal de la base de datos KQL, selecciona Obtener datos.
- Para el origen de datos, selecciona Flujo de eventos > Flujo de eventos existente.
-
En el panel Seleccionar o crear una tabla de destino, crea una nueva tabla denominada
taxi
. Después, en el panel Configurar el origen de datos, selecciona tu área de trabajo y el Eventstream taxi-data y asigna a la conexión el nombretaxi-table
. -
Usa el botón Siguiente para completar los pasos para inspeccionar los datos y después finalizar la configuración. Después cierra la ventana de configuración para ver tu centro de eventos con la tabla Existencias.
Se ha creado la conexión entre el flujo y la tabla. Vamos a comprobarlo en el flujo de eventos.
-
En la barra de menús de la izquierda, selecciona el centro en tiempo real y después consulta la página Mis flujos de datos. En el menú … para el flujo taxi-data-stream, selecciona Abrir Eventstream.
El flujo de eventos muestra ahora un destino para el flujo:
Sugerencia: selecciona el destino en el lienzo de diseño y, si no se muestra ninguna versión preliminar de datos debajo de él, selecciona Actualizar.
En este ejercicio, has creado una secuencia de eventos muy sencilla que captura datos en tiempo real y los carga en una tabla. En una solución real, normalmente añadirías transformaciones para agregar los datos a través de ventanas temporales (por ejemplo, para capturar el precio medio de cada acción durante períodos de cinco minutos).
Ahora vamos a explorar cómo puedes consultar y analizar los datos capturados.
Consulta de los datos capturados
El Eventstream captura los datos de las tarifas de taxi en tiempo real y los carga en una tabla de la base de datos KQL. Puedes consultar esta tabla para ver los datos capturados.
- En la barra de menús de la izquierda, selecciona la base de datos del centro de eventos.
- Selecciona el conjunto de consultas para tu base de datos.
-
En el panel de consulta, modifica la primera consulta de ejemplo como se muestra aquí:
taxi | take 100
-
Selecciona el código de consulta y ejecútalo para ver 100 filas de datos de la tabla.
-
Revisa los resultados y, después, modifica la consulta para mostrar el número de recogidas de taxi para cada hora:
taxi | summarize PickupCount = count() by bin(todatetime(tpep_pickup_datetime), 1h)
- Resalta la consulta modificada y ejecútalo para ver los resultados.
- Espera unos segundos, ejecútala de nuevo y observa que el número de recogidas cambia a medida que se agregan nuevos datos a la tabla desde la secuencia en tiempo real.
Limpieza de recursos
En este ejercicio, has creado un centro de eventos, has ingerido datos en tiempo real mediante una secuencia de eventos, has consultado los datos ingeridos en una tabla de base de datos KQL, has creado un panel en tiempo real para visualizar los datos en tiempo real y has configurado una alerta mediante Activator.
Si has terminado de explorar la inteligencia en tiempo real en Fabric, puedes eliminar el área de trabajo que has creado para este ejercicio.
- En la barra de la izquierda, seleccione el icono del área de trabajo.
- En la barra de herramientas, selecciona Configuración del área de trabajo.
- En la sección General, selecciona Quitar esta área de trabajo.