Azure AI Foundry ポータルでドキュメントからデータを抽出する

Azure AI Document Intelligence サービスを使用すると、フォームやドキュメントから情報を分析して抽出し、フィールド名とデータを識別できます。

Document Intelligence は光学式文字認識 (OCR) を基盤としてどのように構築されているでしょうか? OCR は印刷されたドキュメントや手書きのドキュメントを読み取ることができますが、非構造化形式でテキストを抽出します。これはデータベースへの保存や分析が困難です。 Document Intelligence は、データ フィールドやテーブル内の情報など、テキストの構造をキャプチャすることで、非構造化データの意味を解釈します。

この演習では、インテリジェント アプリケーションを作成するための Microsoft のプラットフォームである Azure AI Foundry ポータルで、Azure AI Document Intelligence の事前構築済みモデルを使用して、領収書のデータを認識します。

Azure AI Foundry ポータルでプロジェクトを作成する

  1. ブラウザー タブ内で、Azure AI Foundry に移動します。

  2. ご自分のアカウントでサインインします。

  3. Azure AI Foundry ポータルのホーム ページで [プロジェクトの作成] を選択します。 Azure AI Foundry では、プロジェクトは作業を整理するのに役立つコンテナーです。

    プロジェクトの作成が選択されている Azure AI Foundry ホーム ページのスクリーンショット。

  4. [プロジェクトの作成] ウィンドウに、生成されたプロジェクト名が表示され、そのまま保持できます。 過去にハブを作成したかどうかに応じて、作成する新しい Azure リソースの一覧または既存のハブのドロップダウン リストが表示されます。 既存のハブのドロップダウン リストが表示される場合は、 [新しいハブの作成] を選択し、ハブの一意の名前を作成して、[次へ] を選択します。

    ハブとプロジェクトの名前が自動的に生成された [プロジェクトの作成] ウィンドウのスクリーンショット。

重要: ラボの残りの部分を完了するには、特定の場所にプロビジョニングされた Azure AI サービスのリソースが必要です。

  1. 同じ [プロジェクトの作成] ウィンドウで、[カスタマイズ] を選択し、米国東部、フランス中部、韓国中部、西ヨーロッパ、米国西部のいずれかの場所を選択して、ラボの残りの部分を完了します。 [作成] を選択します。

  2. 作成されるリソースを書き留めます。
    • Az AI サービス
    • Azure AI ハブ
    • Azure AI プロジェクト
    • ストレージ アカウント
    • Key Vault
    • リソース グループ
  3. リソースが作成されると、プロジェクトの [概要] ページに移動します。 画面の左側のメニューで、[AI サービス] を選択します。

    [AI サービス] が選択されているプロジェクト画面の左側のメニューのスクリーンショット。

  4. [AI サービス] ページで、[Vision + Document] タイルを選択して、Azure AI Document Intelligence 機能を試します。

    [AI サービス] ページで選択されている [Vision and Document] タイルのスクリーンショット。

Azure AI Foundry で Azure AI Document Intelligence を使用して領収書を分析する

これで、架空の Northwind Traders 小売企業のレシートを分析する準備ができました。

  1. [Vision + Document] ページで、下にスクロールして [ドキュメント] を選択します。 [Prebuilt models for specific documents] で、[領収書] タイルを選択します。

  2. [試してみる] の下のドロップダウン リストで、Azure AI サービス リソースが選択されていることを確認します。 現状のままにします。

  3. コンピューターで、https://aka.ms/mslearn-receipt を使用して領収書のサンプル画像を開きます。 [ダウンロード] フォルダーまたはデスクトップに保存します。

  4. Azure AI Foundry の [領収書] ページで、[ファイルの参照] を選択し、画像を保存したフォルダーに移動します。 レシートの画像を、次に [開く] を選択します。 画像が画面の左側に表示されます。

    northwind レシートのスクリーンショット。

  5. 右側にある [分析を実行する] を選択します。

  6. 解析が実行されると、結果が返されます。 サービスが、販売者の名前、住所、電話番号、トランザクションの日時、品目、小計、税金、合計金額などの特定のデータ フィールドを認識しています。 各フィールドの横には、フィールドが正しい確率のパーセンテージが表示されています。

    Azure AI Foundry ポータルの領収書分析結果のスクリーンショット。データ フィールドの周囲に境界ボックスが表示され、抽出されたフィールドにテキストが表示されています。

この演習では、Azure AI Foundry ポータルで Azure AI Document Intelligence の事前構築済み領収書モデルを使用しました。 返された結果から、Document Intelligence がどれだけ特定のフィールドを識別できて、日常のドキュメントのデータをより簡単に処理できるようにするかを確認しました。 デモを終了する前に、様々な言語の領収書を含む複数の領収書をサンプルとして使用し、機能を試してみてください。

クリーンアップ

これ以上の演習を行わない場合は、不要になったリソースを削除します。 これにより、不要なコストが発生することを防ぎます。

  1. Azure portal を開き、作成したリソースを含むリソース グループを選択します。
  2. リソースを選択し、[削除] を、次に [はい] を選択して確定します。 これでリソースが削除されます。

詳細情報

この演習では、AI Document Intelligence サービスの一部の機能のみを示しました。 このサービスで実行できる操作の詳細については、Document Intelligence のページを参照してください。