Erkunden von Datenanalysen in Microsoft Fabric

In dieser Übung erkunden Sie die Datenerfassung und -analyse in einem Microsoft Fabric-Lakehouse.

Dieses Lab dauert ungefähr 25 Minuten.

Hinweis: Sie benötigen eine Microsoft Fabric-Lizenz, um diese Übung durchführen zu können. Weitere Informationen zum Aktivieren einer kostenlosen Fabric-Testlizenz finden Sie unter Erste Schritte mit Fabric. Dazu benötigen Sie ein Schul- , Geschäfts- oder Unikonto von Microsoft. Wenn Sie über kein Microsoft-Konto verfügen, können Sie sich für eine kostenlose Testversion von Microsoft Office 365 E3 oder höher registrieren.

Erstellen eines Arbeitsbereichs

Erstellen Sie vor dem Arbeiten mit Daten in Fabric einen Arbeitsbereich mit aktivierter Fabric-Testversion.

  1. Melden Sie sich bei Microsoft Fabric unter https://app.fabric.microsoft.com an.
  2. Wählen Sie auf der Menüleiste auf der linken Seite Arbeitsbereiche aus (Symbol ähnelt 🗇).
  3. Erstellen Sie einen neuen Arbeitsbereich mit einem Namen Ihrer Wahl, und wählen Sie im Bereich Erweitert einen Lizenzierungsmodus mit Fabric-Kapazitäten aus (Testversion, Premium oder Fabric).
  4. Wenn Ihr neuer Arbeitsbereich geöffnet wird, sollte er leer sein.

    Screenshot: Leerer Arbeitsbereich in Power BI

Erstellen eines Lakehouse

Da Sie über einen Arbeitsbereich verfügen, können Sie nun zu Datentechnik im Portal wechseln und ein Data Lakehouse für Ihre Datendateien erstellen.

  1. Wechseln Sie unten links im Portal zur Datentechnik-Benutzeroberfläche.

    Screenshot: Menü zum Wechseln der Benutzeroberfläche.

    Die Datentechnik-Startseite enthält Kacheln zum Erstellen häufig verwendeter Datentechnikressourcen.

  2. Erstellen Sie auf der Datentechnik-Startseite ein neues Lakehouse mit einem Namen Ihrer Wahl.

    Nach etwa einer Minute wird ein neues Lakehouse erstellt:

    Screenshot: Neues Lakehouse

  3. Sehen Sie sich das neue Lakehouse an, und beachten Sie, dass Sie im Bereich Lakehouse-Explorer auf der linken Seite Tabellen und Dateien im Lakehouse durchsuchen können:

    • Der Ordner Tables enthält Tabellen, die Sie mithilfe von SQL abfragen können. Die Tabellen in einem Microsoft Fabric-Lakehouse basieren auf dem Delta-Lake-Open-Source-Dateiformat, das üblicherweise in Apache Spark verwendet wird.
    • Der Ordner Files enthält Datendateien im OneLake-Speicher für das Lakehouse, die nicht verwalteten Deltatabellen zugeordnet sind. Sie können auch Verknüpfungen in diesem Ordner erstellen, um auf extern gespeicherte Daten zu verweisen.

    Derzeit sind keine Tabellen oder Dateien im Lakehouse vorhanden.

Einlesen von Daten

Eine einfache Möglichkeit zum Erfassen von Daten ist das Verwenden der Aktivität Daten kopieren in einer Pipeline, um die Daten aus einer Quelle zu extrahieren und in eine Datei im Lakehouse zu kopieren.

  1. Wählen Sie auf der Seite Start für Ihr Lakehouse im Menü Daten abrufen die Option Neue Datenpipeline aus, und erstellen Sie eine neue Datenpipeline mit dem Namen Ingest Sales Data.
  2. Wählen Sie im Assistenten zum Kopieren von Daten auf der Seite Datenquelle auswählen das Beispieldataset Retail Data Model from Wide World Importers aus.

    Screenshot: Die Seite „Datenquelle auswählen“

  3. Wählen Sie Weiter aus, und zeigen Sie die Tabellen in der Datenquelle auf der Seite Verbindung mit Datenquelle herstellen an.
  4. Wählen Sie die Tabelle dimension_stock_item aus, die Produktdatensätze enthält. Wählen Sie dann Weiter aus, um zur Seite Datenziel auswählen zu gelangen.
  5. Wählen Sie auf der Seite Datenziel auswählen Ihr vorhandenes Lakehouse aus. Wählen Sie Weiteraus.
  6. Legen Sie die folgenden Datenzieloptionen fest, und wählen Sie dann Weiter aus:
    • Stammordner: Tabellen
    • Einstellungen laden: In neue Tabelle laden
    • Name der Zieltabelle: dimension_stock_item
    • Spaltenzuordnungen: Standardzuordnungen unverändert übernehmen
    • Partition aktivieren: Nicht ausgewählt
  7. Stellen Sie sicher, dass auf der Seite Überprüfen + speichern die Option Datenübertragung sofort starten ausgewählt ist, und wählen Sie dann Speichern + ausführen aus.

    Eine neue Pipeline wird wie folgt mit der Aktivität Daten kopieren erstellt:

    Screenshot: Eine Pipeline mit der Aktivität „Daten kopieren“

    Wenn die Pipeline gestartet wird, können Sie ihren Status im Bereich Ausgabe unter dem Pipeline-Designer überwachen. Verwenden Sie das Symbol (Aktualisieren), um den Status zu aktualisieren, und warten Sie, bis der Vorgang erfolgreich abgeschlossen ist.

  8. Wählen Sie in der Hubmenüleiste auf der linken Seite Ihr Lakehouse aus.
  9. Erweitern Sie dann auf der Seite Start im Lakehouse-Explorer die Option Tabellen, und vergewissern Sie sich, dass die Tabelle dimension_stock_item erstellt wurde.

    Hinweis: Wenn die neue Tabelle als nicht identifiziert aufgeführt ist, verwenden Sie die Schaltfläche Aktualisieren auf der Lakehouse-Symbolleiste, um die Ansicht zu aktualisieren.

  10. Wählen Sie die Tabelle dimension_stock_item aus, um den Inhalt anzuzeigen.

    Screenshot: Tabelle „dimension_stock_item“.

Abfragen von Daten in einem Lakehouse

Nachdem Sie nun Daten in einer Tabelle im Lakehouse erfasst haben, können Sie diese mithilfe von SQL abfragen.

  1. Wechseln Sie oben rechts auf der Lakehouse-Seite zu SQL-Analyseendpunkt für Ihr Lakehouse.

    Screenshot: Menü für den SQL-Analyseendpunkt

  2. Wählen Sie auf der Symbolleiste Neue SQL-Abfrage aus. Geben Sie dann den folgenden SQL-Code in den Abfrage-Editor ein:

     SELECT Brand, COUNT(StockItemKey) AS Products
     FROM dimension_stock_item
     GROUP BY Brand
    
  3. Wählen Sie die Schaltfläche ▷ Ausführen aus, um die Abfrage auszuführen und die Ergebnisse zu überprüfen. Es sollten zwei Werte für die Marke vorhanden sein (N/A und Northwind), und es sollte die Anzahl der Produkte der einzelnen Marken angezeigt werden.

    Screenshot: SQL-Abfrage.

Visualisieren von Daten in einem Lakehouse

In Microsoft Fabric-Lakehouses sind alle Tabellen in einem semantischen Datenmodell organisiert, das Sie zum Erstellen von Visualisierungen und Berichten verwenden können.

  1. Wählen Sie unten links auf der Seite im Bereich Explorer die Registerkarte Modell aus, um das Datenmodell für die Tabellen im Lakehouse anzuzeigen (in diesem Fall gibt es nur eine Tabelle).

    Screenshot: Modellseite in einem Fabric-Lakehouse.

  2. Wählen Sie auf der Symbolleiste Neuer Bericht aus, um eine neue Browserregisterkarte mit dem Power BI-Berichts-Designer zu öffnen.
  3. Im Berichts-Designer:
    1. Erweitern Sie im Bereich Daten die Tabelle dimension_stock_item, und wählen Sie die Felder Brand und StockItemKey aus.
    2. Wählen Sie im Bereich Visualisierungen die Visualisierung Gestapeltes Balkendiagramm aus (dies ist die erste aufgeführte Visualisierung). Stellen Sie dann sicher, dass die Y-Achse das Feld Brand enthält, und ändern Sie die Aggregation in der X-Achse in Count, sodass sie das Feld Count of StockItemKey enthält. Ändern Sie schließlich die Größe der Visualisierung im Berichtsbereich so, dass der verfügbare Platz ausgefüllt wird.

      Screenshot eines Power BI-Berichts

    Tipp: Sie können die » -Symbole verwenden, um die Bereiche des Berichts-Designers auszublenden und den Bericht übersichtlicher zu gestalten.

  4. Wählen Sie im Menü Datei die Option Speichern aus, um den Bericht in Ihrem Fabric-Arbeitsbereich als Brand Quantity Report zu speichern.

    Sie können die Browserregisterkarte mit dem Bericht nun schließen, um zu Ihrem Lakehouse zurückzukehren. Sie finden den Bericht auf der Seite für Ihren Arbeitsbereich im Microsoft Fabric-Portal.

Bereinigen von Ressourcen

Wenn Sie die Untersuchung von Microsoft Fabric abgeschlossen haben, können Sie den Arbeitsbereich löschen, den Sie für diese Übung erstellt haben.

  1. Wählen Sie auf der Leiste auf der linken Seite das Symbol für Ihren Arbeitsbereich aus, um alle darin enthaltenen Elemente anzuzeigen.
  2. Wählen Sie im Menü auf der Symbolleiste die Arbeitsbereichseinstellungen aus.
  3. Wählen Sie im Abschnitt Andere die Option Diesen Arbeitsbereich entfernen aus.