Análisis de los datos en un almacenamiento de datos
En Microsoft Fabric, un almacenamiento de datos proporciona una base de datos relacional para análisis a gran escala. A diferencia del punto de conexión de SQL de solo lectura predeterminado para las tablas definidas en un almacén de lago, un almacenamiento de datos proporciona semántica de SQL completa; incluida la capacidad de insertar, actualizar y eliminar datos de las tablas.
Este laboratorio se tarda aproximadamente 30 minutos en completarse.
Nota: Necesitará una evaluación gratuita de Microsoft Fabric para realizar este ejercicio.
Creación de un área de trabajo
Antes de trabajar con datos de Fabric, crea un área de trabajo con la evaluación gratuita de Fabric habilitada.
- En la página principal de Microsoft Fabric, en
https://app.fabric.microsoft.com/home?experience=fabric
, selecciona Synapse Data Warehouse. - En la barra de menús de la izquierda, seleccione Áreas de trabajo (el icono tiene un aspecto similar a 🗇).
- Cree una nueva área de trabajo con el nombre que prefiera y seleccione un modo de licencia que incluya capacidad de Fabric (Evaluación gratuita, Prémium o Fabric).
-
Cuando se abra la nueva área de trabajo, debe estar vacía.
Creación del almacenamiento de datos
Ahora que tiene un área de trabajo, es el momento de crear un almacenamiento de datos. La página principal de Synapse Data Warehouse incluye un acceso directo para crear un nuevo almacén:
-
En la página principal de Synapse Data Warehouse, cree un nuevo almacenamiento con el nombre que prefiera.
Al cabo de un minuto más o menos, se creará un nuevo almacenamiento:
Creación de tablas e inserción de datos
Un almacenamiento es una base de datos relacional en la que se pueden definir tablas y otros objetos.
-
En el nuevo almacenamiento, seleccione el icono Crear tablas con T-SQL y reemplace el código SQL predeterminado por la siguiente instrucción CREATE TABLE:
CREATE TABLE dbo.DimProduct ( ProductKey INTEGER NOT NULL, ProductAltKey VARCHAR(25) NULL, ProductName VARCHAR(50) NOT NULL, Category VARCHAR(50) NULL, ListPrice DECIMAL(5,2) NULL ); GO
- Use el botón ▷ Ejecutar para ejecutar el script de SQL, que crea una nueva tabla llamada DimProduct en el esquema dbo del almacenamiento de datos.
- Use el botón Actualizar de la barra de herramientas para actualizar la vista. A continuación, en el panel Explorador, expanda Esquemas > dbo > Tablas y compruebe que se ha creado la tabla DimProduct.
-
En la pestaña del menú Inicio, use el botón Nueva consulta SQL para crear una nueva consulta y escriba la siguiente instrucción INSERT:
INSERT INTO dbo.DimProduct VALUES (1, 'RING1', 'Bicycle bell', 'Accessories', 5.99), (2, 'BRITE1', 'Front light', 'Accessories', 15.49), (3, 'BRITE2', 'Rear light', 'Accessories', 15.49); GO
- Ejecute la nueva consulta para insertar tres filas en la tabla DimProduct.
- Cuando finalice la consulta, seleccione la pestaña Datos en la parte inferior de la página del almacenamiento de datos. En el panel Explorador, seleccione la tabla DimProduct y compruebe que las tres filas se han agregado a la tabla.
- En la pestaña del menú Inicio, use el botón Nueva consulta SQL para crear una nueva consulta. A continuación, copie y pegue el código de Transact-SQL desde
https://raw.githubusercontent.com/MicrosoftLearning/dp-data/main/create-dw.txt
en el nuevo panel de consulta. - Ejecute la consulta, que crea un esquema de almacenamiento de datos simple y carga algunos datos. El script debe tardar unos 30 segundos en ejecutarse.
- Use el botón Actualizar de la barra de herramientas para actualizar la vista. A continuación, en el panel Explorador, compruebe que el esquema dbo del almacenamiento de datos contiene ahora las cuatro tablas siguientes:
- DimCustomer
- DimDate
- DimProduct
- FactSalesOrder
Sugerencia: Si el esquema tarda un tiempo en cargarse, actualice la página del explorador.
Definición de un modelo de datos
Normalmente, un almacenamiento de datos relacional consta de tablas de hechos y dimensiones. Las tablas de hechos contienen medidas numéricas que se pueden agregar para analizar el rendimiento empresarial (por ejemplo, ingresos de ventas) y las tablas de dimensiones contienen atributos de las entidades por las que puede agregar los datos (por ejemplo, producto, cliente o tiempo). En un almacenamiento de datos de Microsoft Fabric, puede usar estas claves para definir un modelo de datos que encapsula las relaciones entre las tablas.
- En la parte inferior de la página del almacenamiento de datos, seleccione la pestaña Modelo.
-
En el panel del modelo, reorganice las tablas del almacenamiento de datos para que la tabla FactSalesOrder esté en el medio, de la siguiente manera:
- Arrastre el campo ProductKey de la tabla FactSalesOrder y colóquelo en el campo ProductKey de la tabla DimProduct. A continuación, confirme los siguientes detalles de relación:
- Tabla 1: FactSalesOrder
- Columna: ProductKey
- Tabla 2: DimProduct
- Columna: ProductKey
- Cardinalidad: Varios a uno (*:1)
- Dirección del filtro cruzado: Único
- Activar esta relación: Seleccionado
- Asumir integridad referencial: No seleccionado
- Repita el proceso para crear relaciones de varios a uno entre las tablas siguientes:
- FactSalesOrder.CustomerKey → DimCustomer.CustomerKey
- FactSalesOrder.SalesOrderDateKey → DimDate.DateKey
Cuando se hayan definido todas las relaciones, el modelo debe tener este aspecto:
Consulta de las tablas de almacenamiento de datos
Dado que el almacenamiento de datos es una base de datos relacional, puede usar SQL para consultar sus tablas.
Tablas de hechos y dimensiones
La mayoría de las consultas de un almacenamiento de datos relacional implican agregar y agrupar datos (mediante funciones de agregado y cláusulas GROUP BY) en tablas relacionadas (mediante cláusulas JOIN).
-
Cree una nueva consulta SQL y ejecute el código siguiente:
SELECT d.[Year] AS CalendarYear, d.[Month] AS MonthOfYear, d.MonthName AS MonthName, SUM(so.SalesTotal) AS SalesRevenue FROM FactSalesOrder AS so JOIN DimDate AS d ON so.SalesOrderDateKey = d.DateKey GROUP BY d.[Year], d.[Month], d.MonthName ORDER BY CalendarYear, MonthOfYear;
Ten en cuenta que los atributos de la dimensión de fecha te permiten agregar las medidas de la tabla de hechos en varios niveles jerárquicos, en este caso, año y mes. Se trata de un patrón común en los almacenamientos de datos.
-
Modifique la consulta de la siguiente manera para agregar una segunda dimensión a la agregación.
SELECT d.[Year] AS CalendarYear, d.[Month] AS MonthOfYear, d.MonthName AS MonthName, c.CountryRegion AS SalesRegion, SUM(so.SalesTotal) AS SalesRevenue FROM FactSalesOrder AS so JOIN DimDate AS d ON so.SalesOrderDateKey = d.DateKey JOIN DimCustomer AS c ON so.CustomerKey = c.CustomerKey GROUP BY d.[Year], d.[Month], d.MonthName, c.CountryRegion ORDER BY CalendarYear, MonthOfYear, SalesRegion;
-
Ejecute la consulta modificada y revise los resultados, que ahora incluyen los ingresos de ventas agregados por año, mes y región de ventas.
Creación de una vista
Un almacenamiento de datos en Microsoft Fabric tiene muchas de las mismas funcionalidades con las que puede estar familiarizado en las bases de datos relacionales. Por ejemplo, puede crear objetos de base de datos como vistas y procedimientos almacenados para encapsular lógica SQL.
-
Modifique la consulta que creó anteriormente como se indica a continuación para crear una vista (tenga en cuenta que para ello debe quitar la cláusula ORDER BY).
CREATE VIEW vSalesByRegion AS SELECT d.[Year] AS CalendarYear, d.[Month] AS MonthOfYear, d.MonthName AS MonthName, c.CountryRegion AS SalesRegion, SUM(so.SalesTotal) AS SalesRevenue FROM FactSalesOrder AS so JOIN DimDate AS d ON so.SalesOrderDateKey = d.DateKey JOIN DimCustomer AS c ON so.CustomerKey = c.CustomerKey GROUP BY d.[Year], d.[Month], d.MonthName, c.CountryRegion;
- Ejecute la consulta para crear la vista. A continuación, actualice el esquema de almacenamiento de datos y compruebe que la nueva vista aparece en el panel Explorador.
-
Cree una nueva consulta SQL y ejecute la siguiente instrucción SELECT:
SELECT CalendarYear, MonthName, SalesRegion, SalesRevenue FROM vSalesByRegion ORDER BY CalendarYear, MonthOfYear, SalesRegion;
Creación de una consulta visual
En lugar de escribir código SQL, puede usar el diseñador gráfico de consultas para consultar las tablas en el almacenamiento de datos. Esta experiencia es similar a Power Query en línea, donde puede crear pasos de transformación de datos sin código. En el caso de tareas más complejas, puede usar el lenguaje M (Mashup) de Power Query.
-
En el menú Inicio, seleccione Nueva consulta visual.
-
Arrastre FactSalesOrder al lienzo. Observe que se muestra una vista previa de la tabla en el panel Vista previa siguiente.
-
Arrastre DimProduct al lienzo. Ahora tenemos dos tablas en nuestra consulta.
-
Use el botón (+) de la tabla FactSalesOrder en el lienzo para combinar consultas.
-
En la ventana Combinar consultas, seleccione DimProduct (la tabla correcta para combinar). Seleccione ProductKey en ambas consultas, deje el tipo de combinación predeterminado Externa izquierda y haga clic en Aceptar.
-
En Vista previa, observe que la nueva columna DimProduct se ha agregado a la tabla FactSalesOrder. Expanda la columna haciendo clic en la flecha situada a la derecha del nombre de la columna. Seleccione ProductName y haga clic en Aceptar.
-
Si está interesado en examinar los datos de un solo producto, de acuerdo con una solicitud de administrador, ahora puede usar la columna ProductName para filtrar los datos de la consulta. Filtre la columna ProductName para ver solo los datos de Cable Lock.
-
Desde aquí, puede analizar los resultados de esta única consulta seleccionando Visualizar resultados o Abrir en Excel. Ahora puede ver exactamente lo que solicitó el administrador, por lo que no es necesario seguir analizando los resultados.
Visualización de los datos
Puede visualizar fácilmente los datos en una sola consulta o en el almacenamiento de datos. Antes de visualizarlos, oculte las columnas o tablas que no sean fáciles de usar para los diseñadores de informes.
-
En el panel Explorador, seleccione la vista Modelo.
- Oculte las columnas siguientes de las tablas Fact y Dimension que no son necesarias para crear un informe. Tenga en cuenta que esta acción no quita las columnas del modelo, simplemente las oculta de la vista en el lienzo del informe.
- FactSalesOrder
- SalesOrderDateKey
- CustomerKey
- ProductKey
- DimCustomer
- CustomerKey
- CustomerAltKey
- DimDate
- DateKey
- DateAltKey
- DimProduct
- ProductKey
- ProductAltKey
- FactSalesOrder
-
Ahora está listo para compilar un informe y poner este conjunto de datos a disposición de otros usuarios. En el menú Informes, selecciona Nuevo informe. Se abrirá una nueva ventana, donde puede crear un informe de Power BI.
-
En el panel Datos, expanda FactSalesOrder. Tenga en cuenta que las columnas ocultas ya no están visibles.
- Seleccione SalesTotal. Esta acción agregará la columna al lienzo del informe. Dado que la columna es un valor numérico, el objeto visual predeterminado es un gráfico de columnas.
- Asegúrese de que el gráfico de columnas del lienzo está activo (con un borde gris y controladores) y, luego, seleccione Categoría en la tabla DimProduct para agregar una categoría al gráfico de columnas.
-
En el panel Visualizaciones, cambie el tipo de gráfico de un gráfico de columnas a un gráfico de barras agrupado. A continuación, cambie el tamaño del gráfico según sea necesario para asegurarse de que las categorías son legibles.
-
En el panel Visualizaciones, seleccione la pestaña Dar formato a su objeto visual y, en la subpestaña General, en la sección Título, cambie el texto a Ventas totales por categoría.
-
En el menú Archivo, seleccione Guardar. A continuación, guarde el informe como Informe de ventas en el área de trabajo que creó anteriormente.
-
En el centro de menús de la izquierda, vuelva al área de trabajo. Tenga en cuenta que ahora tiene tres elementos guardados en el área de trabajo: el almacenamiento de datos, su conjunto de datos predeterminado y el informe que ha creado.
Limpieza de recursos
En este ejercicio, ha creado un almacenamiento de datos que contiene varias tablas. Ha usado SQL para insertar datos en las tablas y consultarlas. También se ha usado la herramienta de consulta visual. Por último, ha mejorado el modelo de datos para el conjunto de datos predeterminado del almacenamiento de datos y lo ha usado como origen del informe.
Si ha terminado de explorar el almacenamiento de datos, puede eliminar el área de trabajo que creó para este ejercicio.
- En la barra de la izquierda, seleccione el icono del área de trabajo para ver todos los elementos que contiene.
- En el menú … de la barra de herramientas, seleccione Configuración del área de trabajo.
- En la sección General, seleccione Quitar esta área de trabajo.