Azure Machine Learning 작업 영역 살펴보기

Azure Machine Learning은 Machine Learning 모델을 학습하고 관리하기 위한 데이터 과학 플랫폼을 제공합니다. 이 랩에서는 Azure Machine Learning 작업 영역을 만들어 사용하는 다양한 방법을 살펴봅니다. 이 랩은 Azure Machine Learning 및 개발자 도구의 다양한 핵심 기능을 소개하도록 설계되었습니다. 기능에 대해 더 자세히 알아보려면 다른 랩을 살펴봅니다.

시작하기 전에

관리 수준 액세스 권한이 있는 Azure 구독이 필요합니다.

Azure Machine Learning 작업 영역 프로비저닝

Azure Machine Learning 작업 영역은 모델을 학습하고 관리하는 데 필요한 모든 리소스 및 자산을 관리하기 위한 중심지를 제공합니다.** Azure Portal의 대화형 인터페이스를 사용하여 작업 영역을 프로비전하거나 Azure Machine Learning 확장과 함께 Azure CLI를 사용할 수 있습니다. 대부분의 프로덕션 시나리오에서는 리소스 배포를 반복 가능한 개발 및 운영(DevOps) 프로세스에 통합할 수 있도록 CLI를 사용하여 프로비전을 자동화하는 것이 가장 좋습니다.

이 연습에서는 Azure Portal을 사용하여 Azure Machine Learning을 프로비전하고 모든 옵션을 살펴봅니다.

  1. https://portal.azure.com/에 로그인합니다.
  2. 다음 설정을 사용하여 새 Azure Machine Learning 리소스를 만듭니다.
    • 구독: ‘Azure 구독’
    • 리소스 그룹: rg-dp100-labs
    • 작업 영역 이름: mlw-dp100-labs
    • 지역: ‘지리적으로 가장 가까운 지역 선택’**
    • 스토리지 계정: ‘작업 영역에 대해 만들 새로운 기본 스토리지 계정’
    • 키 자격 증명 모음: ‘작업 영역에 대해 만들 새로운 기본 키 자격 증명 모음’
    • Application insights: ‘작업 영역에 대해 만들 새로운 기본 Application Insights 리소스’
    • 컨테이너 레지스트리: 없음(‘처음으로 컨테이너에 모델을 배포할 때 자동으로 만들어짐’)
  3. 작업 영역 및 관련 리소스가 만들어질 때까지 기다립니다. 일반적으로 약 5분 정도 걸립니다.

참고: Azure Machine Learning 작업 영역을 만들 때는 몇 가지 고급 옵션을 사용하여 프라이빗 엔드포인트를 통한 액세스를 제한하고 데이터 암호화용 사용자 지정 키를 지정할 수 있습니다. 이 연습에서는 이러한 옵션을 사용하지 않지만 그러한 옵션이 있다는 것은 기억해 두어야 합니다.

Azure Machine Learning 스튜디오 살펴보기

Azure Machine Learning 스튜디오는 Azure Machine Learning 작업 영역에 액세스할 수 있는 웹 기반 포털입니다. Azure Machine Learning 스튜디오를 사용하여 작업 영역 내의 모든 자산과 리소스를 관리할 수 있습니다.

  1. rg-dp100-labs라는 리소스 그룹으로 이동합니다.
  2. 리소스 그룹에 Azure Machine Learning 작업 영역, Application Insights, Key Vault 및 스토리지 계정이 포함되어 있는지 확인합니다.
  3. Azure Machine Learning 작업 영역을 선택합니다.
  4. 개요 페이지에서 스튜디오 시작을 선택합니다. Azure Machine Learning 스튜디오를 열 수 있는 또 다른 탭이 브라우저에 열립니다.
  5. 스튜디오에 나타나는 팝업을 모두 닫으세요.
  6. 스튜디오 왼쪽에 표시된 다양한 페이지를 참고합니다. 메뉴에 기호만 표시되는 경우 ☰ 아이콘을 클릭하면 메뉴를 확장하고 페이지 이름을 탐색할 수 있습니다.
  7. Notebooks, 자동화된 ML디자이너가 포함된 작성 섹션을 확인합니다. Azure Machine Learning 스튜디오 내에서 고유한 Machine Learning 모델을 만들 수 있는 세 가지 방법이 있습니다.
  8. 무엇보다도 데이터, 작업모델을 포함하는 자산 섹션을 확인합니다. 모델을 학습하거나 채점할 때 자산이 사용되거나 만들어집니다. 자산은 모델을 학습, 배포 및 관리하는 데 사용되며 버전을 관리하여 기록을 추적할 수 있습니다.
  9. 무엇보다도 컴퓨팅이 포함된 관리 섹션을 확인합니다. 이는 기계 학습 모델을 학습하거나 배포하는 데 필요한 인프라 리소스입니다.

AutoML을 사용하여 모델 학습

Azure Machine Learning 작업 영역에서 자산 및 리소스의 사용을 살펴보기 위해 모델을 학습시켜 보겠습니다.

데이터를 기반으로 작업에 가장 적합한 모델을 빠르게 학습하고 찾는 방법은 AutoML 옵션을 사용하는 것입니다.

참고: 스튜디오 전체를 안내하는 팝업이 전반적으로 나타날 수 있습니다. 모든 팝업을 닫아 무시하고 이 랩의 지침에 집중할 수 있습니다.

  1. https://github.com/MicrosoftLearning/mslearn-azure-ml/raw/refs/heads/main/Labs/02/diabetes-data.zip에서 사용할 학습 데이터를 다운로드하고 압축 파일을 추출합니다.
  2. Azure Machine Learning 스튜디오로 돌아가서 스튜디오 왼쪽의 메뉴에서 AutoML 페이지를 선택합니다.
  3. +새 자동화된 ML 작업을 선택합니다.
  4. 기본 설정 단계에서 학습 작업에 고유한 이름을 지정하고 할당된 기본값을 실험하거나 사용합니다. 다음을 선택합니다.
  5. 작업 종류 및 데이터 단계에서 작업 종류로 분류를 선택하고, + 만들기를 선택하여 학습 데이터를 추가합니다.
  6. 데이터 자산 만들기 페이지의 데이터 형식 단계에서 데이터 자산에 이름을 지정하고(예: training-data) 다음을 선택합니다.
  7. 데이터 원본 단계에서 로컬 파일에서를 선택하여 이전에 다운로드한 학습 데이터를 업로드합니다. 다음을 선택합니다.
  8. 대상 저장소 유형 단계에서 Azure Blob Storage가 데이터 저장소 유형으로 선택되어 있고 workspaceblobstore가 선택된 데이터 저장소인지 확인합니다. 다음을 선택합니다.
  9. MLTable 선택 단계에서 폴더 업로드를 선택하고, 이전에 다운로드한 압축 파일에서 압축을 푼 폴더를 선택합니다. 다음을 선택합니다.
  10. 데이터 자산의 설정을 검토하고 만들기를 선택합니다.
  11. 작업 종류 및 데이터 단계로 돌아가서 방금 업로드한 데이터를 선택하고 다음을 선택합니다.

: 다음 단계로 이동하기 전에 분류 작업 종류를 다시 선택해야 할 수도 있습니다.

  1. 작업 설정 단계에서 당뇨병(부울) 을 대상 열로 선택한 다음 추가 구성 설정 보기 옵션을 엽니다.
  2. 추가 구성 창에서 기본 메트릭을 정확도로 변경한 다음 저장을 선택합니다.
  3. 제한 옵션을 확장하고 다음 속성을 설정합니다.
    • 최대 시도 횟수: 10
    • 실험 시간 제한(분): 60
    • 반복 시간 제한(분): 15
    • 조기 종료 사용:
  4. 데이터 테스트에서 학습-테스트 분할을 선택하고 데이터의 백분율 테스트가 10인지 확인합니다. 다음을 선택합니다.
  5. 컴퓨팅 단계에서 컴퓨팅 유형이 서버리스이고 선택한 가상 머신 크기가 Standard_DS3_v2인지 확인합니다. 다음을 선택합니다.

참고: 컴퓨팅 인스턴스 및 클러스터는 표준 Azure 가상 머신 이미지를 기반으로 합니다. 이 연습에서는 비용과 성능의 최적의 균형을 맞추기 위해 Standard_DS3_v2 이미지를 권장합니다. 구독에 이 이미지를 포함하지 않는 할당량이 있는 경우 다른 이미지를 선택하세요. 하지만 이미지가 클수록 비용이 더 많이 들 수 있고 더 작은 이미지는 작업을 완료하기에 충분하지 않을 수 있습니다. 또는 Azure 관리자에게 할당량을 확장하도록 요청하세요.

  1. 모든 설정을 검토하고 학습 작업 제출을 선택합니다.

작업을 통해 기록 보기

작업을 제출하면 작업 페이지로 리디렉션됩니다. 작업을 사용하면 실행한 워크로드를 추적하고 서로 비교할 수 있습니다. 작업은 작업 실행을 그룹화할 수 있는 실험에 속합니다.

  1. 개요 매개 변수에서는 (무엇보다도) 작업의 상태, 만든 사람, 만든 시기, 실행에 걸린 시간 등을 확인할 수 있습니다.
  2. 학습 작업이 완료되려면 10-20분이 걸립니다. 작업이 완료되면 출력을 포함하여 각 개별 구성 요소 실행의 세부 정보도 볼 수 있습니다. 모델 학습 방법을 이해하려면 작업 페이지를 자유롭게 탐색해 보세요.

    또한 Azure Machine Learning은 작업 속성을 자동으로 추적합니다. 작업을 사용하면 내역을 쉽게 확인하여 자신이나 동료가 이미 수행한 작업을 파악할 수 있습니다. 실험 중에 작업은 학습한 다양한 모델을 추적하여 최상의 모델을 비교하고 식별하는 데 도움이 됩니다. 프로덕션 중에 작업을 통해 자동화된 워크로드가 예상대로 실행되었는지 확인할 수 있습니다.

Azure 리소스 삭제

Azure Machine Learning 탐색을 마치면 지금까지 만든 리소스를 삭제하여 불필요한 Azure 비용을 방지해야 합니다.

  1. Azure Machine Learning 스튜디오 탭을 닫고 Azure Portal로 돌아갑니다.
  2. Azure Portal의 페이지에서 리소스 그룹을 선택합니다.
  3. rg-dp100-labs 리소스 그룹을 선택합니다.
  4. 리소스 그룹의 개요 페이지에서 리소스 그룹 삭제를 선택합니다.
  5. 리소스 그룹 이름을 입력하여 삭제 의사를 확인한 다음 삭제를 선택합니다.