Извлечение данных формы в Document Intelligence Studio

Аналитика документов ИИ Azure может анализировать и извлекать информацию из форм и документов, а затем определять имена полей и данные.

Как аналитика документов основана на оптическом распознавании символов (OCR)? Хотя OCR может считывать печатные или рукописные документы, OCR извлекает текст в неструктурированном формате, который трудно хранить в базе данных или анализировать. Аналитика документов имеет смысл для неструктурированных данных, записывая структуру текста, например пары “ключ-значение” и сведения в таблицах.

В этом упражнении вы изучите предварительно созданную модель в аналитике документов, которая обучена распознавать данные для получения квитанций.

ПРИМЕЧАНИЕ. Аналитика документов ИИ Azure — это новое имя для Azure Распознаватель документов. Вы по-прежнему можете увидеть Azure Распознаватель документов в портал Azure или Document Intelligence Studio.

Создание ресурса аналитики документов

Вы можете использовать Аналитику документов Azure СИ, создав ресурс аналитики документов или ресурс служб ИИ Azure. В этом упражнении вы создадите ресурс аналитики документов, если у вас еще нет.

  1. На другой вкладке браузера откройте Document Intelligence Studio, выполнив вход с помощью учетной записи Майкрософт.
  2. Выберите Параметры и выберите вкладку “Ресурс”. Выберите “Создать ресурс”.
  3. В диалоговом окне “Создание ресурса” введите следующее:
    • Подписка: ваша подписка Azure.
    • Группа ресурсов: выберите существующую или создайте новую группу ресурсов с уникальным именем.
    • Новое имя ресурса: введите уникальное имя.
    • Расположение: выберите регион.
    • Ценовая категория: бесплатная fo (если она доступна, в противном случае выберите standard SO).
  4. Нажмите кнопку “Продолжить “, а затем “Готово”. Дождитесь, пока завершится развертывание ресурса.

    Примечание. Если ресурс еще не отображается, может потребоваться обновить страницу.

Оставайтесь открытыми в Студии аналитики документов.

Анализ квитанции в Document Intelligence Studio

Теперь вы готовы проанализировать квитанцию для вымышленной розничной компании Northwind Traders.

  1. Выберите**https://aka.ms/mslearn-receipt, чтобы скачать пример документа на компьютер. Откройте папку .
  2. Выберите Document Intelligence Studio, чтобы вернуться на **страницу “Начало работы с Document Intelligence Studio” и в разделе “Квитанции” выберите “Попробовать”.**
  3. В раскрывающемся списке предварительно созданного списка убедитесь, что выбраны квитанции .
  4. Выберите “Обзор файлов “ и перейдите в папку, в которой вы сохранили рисунок. Выберите рисунок квитанции и откройте его. Изображение отображается в левой части экрана.

    Квитанция Northwind.

  5. Справа выберите “Выполнить анализ”.
  6. При выполнении анализа возвращаются результаты. Обратите внимание, что служба распознала определенные поля данных, такие как имя продавца, адрес, номер телефона и дата и время транзакции, а также элементы строки, промежуточные итоги, налог и общие суммы. Рядом с каждым полем является процентная вероятность правильности поля.

В этом упражнении вы использовали Document Intelligence Studio для создания ресурса аналитики документов. Затем вы использовали службу для анализа квитанции. Из возвращаемых результатов вы узнали, как аналитика документов могла идентифицировать определенные поля, что позволяет обрабатывать данные из повседневных документов. Прежде чем закрыть Document Intelligence Studio, почему бы не попробовать некоторые примеры квитанций, включая те, на разных языках?

Очистка

Если вы не собираетесь выполнять больше упражнений, удалите все ресурсы, которые больше не нужны. Это позволяет избежать каких-либо ненужных затрат.

  1. Откройте портал Azure и выберите группу ресурсов, содержащую созданный ресурс.
  2. Выберите ресурс и нажмите кнопку “Удалить “, а затем “Да “, чтобы подтвердить. Затем ресурс удаляется.

Подробнее

Это упражнение демонстрирует только некоторые возможности службы аналитики документов ИИ. Дополнительные сведения о возможностях этой службы см. на странице “Аналитика документов”.