從 Azure AI Foundry 入口網站的文件中擷取資料
Azure AI 文件智慧服務能夠分析及擷取表單和文件的資訊,然後識別欄位名稱和資料。
文件智慧服務如何建立光學字元辨識 (OCR) 上? 雖然 OCR 可以讀取列印或手寫的文件,但 OCR 會擷取非結構化格式的文字,難以儲存至資料庫中或進行分析。 文件智慧服務藉由擷取文字的結構 (例如,表格中的資料欄位和資訊) 來理解非結構化資料。
在此練習中,您將在 Microsoft 用來建立智慧型應用程式的平台 Azure AI Foundry 入口網站中,使用 Azure AI 文件智慧服務預先建立的模型,辨識收據中的資料。
在 Azure AI Foundry 入口網站中建立專案
-
使用您的帳戶登入。
-
在 Azure AI Foundry 入口網站的首頁中,選取 [建立專案]**。 在 Azure AI Foundry 中,專案是可協助您組織工作的容器。
-
在 [建立專案]** 窗格中,您會看到產生的專案名稱,您可以保留現有名稱。 視您過去是否已建立中樞而定,您將會看到要建立的新 Azure 資源清單或現有中樞的下拉式清單。 如果您看到現有中樞的下拉式清單,請選取 [建立新中樞],為您的中樞建立唯一的名稱,然後選取 [下一步]。
重要:您需要在特定位置佈建 Azure AI 服務資源,才能完成實驗的其餘部分。
-
在相同的 [建立專案]** 窗格中,選取 [自訂]**,然後選取下列其中一個位置:美國東部、法國中部、韓國中部、西歐或美國西部,以完成實驗的其餘部分。 然後選取 [建立]**。
- 記下所建立的資源:
- Azure AI 服務
- Azure AI 中樞
- Azure AI 專案
- 儲存體帳戶
- 金鑰保存庫
- 資源群組
-
建立資源之後,系統會將您帶到專案的 [概觀]** 頁面。 在畫面的左側功能表上,選取 [AI 服務]**。
-
在 [AI 服務]** 頁面上,選取 [視覺 + 文件]** 圖格,以試用 Azure AI 文件智慧服務功能。
使用 Azure AI Foundry 中的 Azure AI 文件智慧服務分析收據
您現在已準備好分析虛構 Northwind Traders 零售公司的收據。
-
在 [視覺 + 文件]** 頁面上,向下捲動並選取 [文件]**。 在 [特定文件的預先建立模型] 底下,選取 [收據]** 圖格。
-
在 [試用]** 下的下拉式清單中,請注意已選取您的 Azure AI 服務資源。 保持原狀。
-
在您的電腦上,使用 https://aka.ms/mslearn-receipt 開啟收據的範例影像。 將它儲存至 [下載] 資料夾或桌面。
-
在 Azure AI Foundry 的 [收據]** 頁面,選取 [瀏覽以找到檔案]**,然後瀏覽至您儲存圖片的資料夾。 選取收據的圖片,然後 [開啟]**。 圖片隨即出現在視窗左側。
-
在右側,選取 [執行分析]**。
-
當分析執行時,會傳回結果。 請注意,服務已辨識特定資料欄位,例如商家的名稱、地址、電話號碼和交易日期和時間,以及商品明細、小計、稅金和總金額。 每個欄位旁邊是該欄位正確的百分比可能性。
在此練習中,您已使用 Azure AI Foundry 入口網站中 Azure AI 文件智慧服務預先建立的收據模型。 從傳回的結果中,您已了解文件智慧服務如何識別特定欄位,讓日常文件的資料更加容易處理。 在您關閉示範之前,為什麼不嘗試一些範例收據,包括不同語言的收據?
清理
如果您不打算進行更多的練習,請刪除不再需要的任何資源。 這可以避免產生任何不必要的成本。
- 開啟 Azure 入口網站,然後選取您建立的資源所屬的資源群組。
- 選取資源並選取 [刪除]**,然後再選取 [是]** 加以確認。 接著即會刪除該資源。
深入了解
此練習僅示範 AI 文件智慧服務的部分功能。 若要深入了解這項服務的功用,請參閱文件智慧服務 (部分機器翻譯) 頁面。