문서 인텔리전스 스튜디오에서 양식 데이터 추출

Azure AI 문서 인텔리전스는 양식과 문서에서 정보를 분석 및 추출한 다음, 필드 이름과 데이터를 식별할 수 있습니다.

문서 인텔리전스는 OCR(광학 인식)을 기반으로 어떻게 빌드되나요? OCR은 인쇄된 문서나 손으로 쓴 문서를 읽을 수 있는 반면, OCR은 데이터베이스에 저장하거나 분석하기 어려운 구조화되지 않은 형식의 텍스트를 추출합니다. 문서 인텔리전스는 키/값 쌍 및 테이블의 정보와 같은 텍스트 구조를 캡처하여 구조화되지 않은 데이터를 이해합니다.

이 연습에서는 영수증 데이터를 인식하도록 학습된 문서 인텔리전스의 미리 빌드된 모델을 살펴보겠습니다.

참고 Azure AI 문서 인텔리전스는 Azure Form Recognizer의 새로운 이름입니다. Azure Portal 또는 문서 인텔리전스 스튜디오에 Azure Form Recognizer가 계속 표시될 수 있습니다.

문서 인텔리전스 리소스 만들기

문서 인텔리전스 리소스 또는 Azure AI 서비스 리소스를 만들어 Azure AI 문서 인텔리전스를 사용할 수 있습니다. 이 연습에서는 아직 문서 인텔리전스 리소스가 없는 경우 이를 만듭니다.

  1. 다른 브라우저 탭에서 문서 인텔리전스 스튜디오를 열고 Microsoft 계정으로 로그인합니다.
  2. 설정을 선택하고 리소스 탭을 선택합니다. 새 리소스 만들기를 선택합니다.
  3. 리소스 만들기 대화 상자에서 다음을 입력합니다.
    • 구독: 자신의 Azure 구독.
    • 리소스 그룹: 고유한 이름이 있는 리소스 그룹을 선택하거나 생성합니다.
    • 새 리소스 이름: 고유한 이름을 입력합니다.
    • 위치: 지역을 선택합니다. 미국 동부에 있는 경우 “미국 동부 2” 를 사용합니다.
    • 가격 책정 계층: 무료 FO(사용 가능한 경우, 그렇지 않으면 표준 SO 선택).
  4. 계속을 선택한 다음 마침을 선택합니다. 리소스가 배포될 때까지 기다립니다.

    참고 리소스가 아직 표시되지 않은 경우 페이지를 새로 고침해야 할 수도 있습니다.

문서 인텔리전스 스튜디오를 열어두세요.

문서 인텔리전스 스튜디오에서 영수증 분석

이제 가상의 Northwind Traders 소매 회사에 대한 영수증을 분석할 준비가 되었습니다.

  1. 샘플 문서를 컴퓨터에 다운로드하려면 https://aka.ms/mslearn-receipt를 선택합니다. 폴더를 엽니다.
  2. 문서 인텔리전스 스튜디오를 선택하여 문서 인텔리전스 스튜디오 시작 페이지로 돌아가고 영수증에서 시도를 선택합니다.
  3. 미리 빌드된 드롭다운 목록에서 영수증이 선택되어 있는지 확인합니다.
  4. 파일 찾아보기를 선택하고 그림을 저장한 폴더로 이동합니다. 영수증 그림을 선택한 다음 열기를 선택합니다. 이미지가 화면 왼쪽에 나타납니다.

    northwind 영수증의 스크린샷.

  5. 오른쪽에서 분석 실행을 선택합니다.
  6. 분석이 실행되면 결과가 반환됩니다. 서비스는 판매자 이름, 주소, 전화 번호, 트랜잭션 날짜 및 시간과 같은 특정 데이터 필드는 물론 항목, 소계, 세금 및 총액을 인식했습니다. 각 필드 옆에는 해당 필드가 정확할 확률(%)이 표시됩니다.

이 연습에서는 문서 인텔리전스 스튜디오를 사용하여 문서 인텔리전스 리소스를 만들었습니다. 그런 다음 서비스를 사용하여 영수증을 분석했습니다. 반환된 결과에서 문서 인텔리전스가 특정 필드를 식별하여 일상적인 문서의 데이터를 보다 쉽게 처리할 수 있는 방법을 확인했습니다. 문서 인텔리전스 스튜디오를 닫기 전에 다양한 언어로 된 영수증을 포함하여 샘플 영수증을 사용해 보는 것은 어떨까요?

정리

더 이상 연습할 생각이 없다면 더 이상 필요하지 않은 리소스를 삭제합니다. 이렇게 하면 불필요한 비용이 발생하는 것을 방지할 수 있습니다.

  1. Azure Portal을 열고 만든 리소스가 포함된 리소스 그룹을 선택합니다.
  2. 리소스를 선택하고 삭제를 선택한 다음 를 선택하여 확인합니다. 그러면 리소스가 삭제됩니다.

자세한 정보

이 연습에서는 AI 문서 인텔리전스 서비스의 일부 기능만 시연했습니다. 이 서비스로 수행할 수 있는 작업에 대해 자세히 알아보려면 문서 인텔리전스 페이지를 참조하세요.