Azure Machine Learning 작업 영역 살펴보기
Azure Machine Learning은 Machine Learning 모델을 학습하고 관리하기 위한 데이터 과학 플랫폼을 제공합니다. 이 랩에서는 Azure Machine Learning 작업 영역을 만들어 사용하는 다양한 방법을 살펴봅니다. 이 랩은 Azure Machine Learning 및 개발자 도구의 다양한 핵심 기능을 소개하도록 설계되었습니다. 기능에 대해 더 자세히 알아보려면 다른 랩을 살펴봅니다.
시작하기 전에
관리 수준 액세스 권한이 있는 Azure 구독이 필요합니다.
Azure Machine Learning 작업 영역 프로비저닝
Azure Machine Learning 작업 영역은 모델을 학습하고 관리하는 데 필요한 모든 리소스 및 자산을 관리하기 위한 중심지를 제공합니다.** Azure Portal의 대화형 인터페이스를 사용하여 작업 영역을 프로비전하거나 Azure Machine Learning 확장과 함께 Azure CLI를 사용할 수 있습니다. 대부분의 프로덕션 시나리오에서는 리소스 배포를 반복 가능한 개발 및 운영(DevOps) 프로세스에 통합할 수 있도록 CLI를 사용하여 프로비전을 자동화하는 것이 가장 좋습니다.
이 연습에서는 Azure Portal을 사용하여 Azure Machine Learning을 프로비전하고 모든 옵션을 살펴봅니다.
https://portal.azure.com/
에 로그인합니다.- 다음 설정을 사용하여 새 Azure Machine Learning 리소스를 만듭니다.
- 구독: ‘Azure 구독’
- 리소스 그룹:
rg-dp100-labs
- 작업 영역 이름:
mlw-dp100-labs
- 지역: ‘지리적으로 가장 가까운 지역 선택’**
- 스토리지 계정: ‘작업 영역에 대해 만들 새로운 기본 스토리지 계정’
- 키 자격 증명 모음: ‘작업 영역에 대해 만들 새로운 기본 키 자격 증명 모음’
- Application insights: ‘작업 영역에 대해 만들 새로운 기본 Application Insights 리소스’
- 컨테이너 레지스트리: 없음(‘처음으로 컨테이너에 모델을 배포할 때 자동으로 만들어짐’)
- 작업 영역 및 관련 리소스가 만들어질 때까지 기다립니다. 일반적으로 약 5분 정도 걸립니다.
참고: Azure Machine Learning 작업 영역을 만들 때는 몇 가지 고급 옵션을 사용하여 프라이빗 엔드포인트를 통한 액세스를 제한하고 데이터 암호화용 사용자 지정 키를 지정할 수 있습니다. 이 연습에서는 이러한 옵션을 사용하지 않지만 그러한 옵션이 있다는 것은 기억해 두어야 합니다.
Azure Machine Learning 스튜디오 살펴보기
Azure Machine Learning 스튜디오는 Azure Machine Learning 작업 영역에 액세스할 수 있는 웹 기반 포털입니다. Azure Machine Learning 스튜디오를 사용하여 작업 영역 내의 모든 자산과 리소스를 관리할 수 있습니다.
- rg-dp100-labs라는 리소스 그룹으로 이동합니다.
- 리소스 그룹에 Azure Machine Learning 작업 영역, Application Insights, Key Vault 및 스토리지 계정이 포함되어 있는지 확인합니다.
- Azure Machine Learning 작업 영역을 선택합니다.
- 개요 페이지에서 스튜디오 시작을 선택합니다. Azure Machine Learning 스튜디오를 열 수 있는 또 다른 탭이 브라우저에 열립니다.
- 스튜디오에 나타나는 팝업을 모두 닫으세요.
- 스튜디오 왼쪽에 표시된 다양한 페이지를 참고합니다. 메뉴에 기호만 표시되는 경우 ☰ 아이콘을 클릭하면 메뉴를 확장하고 페이지 이름을 탐색할 수 있습니다.
- Notebooks, 자동화된 ML 및 디자이너가 포함된 작성 섹션을 확인합니다. Azure Machine Learning 스튜디오 내에서 고유한 Machine Learning 모델을 만들 수 있는 세 가지 방법이 있습니다.
- 무엇보다도 데이터, 작업 및 모델을 포함하는 자산 섹션을 확인합니다. 모델을 학습하거나 채점할 때 자산이 사용되거나 만들어집니다. 자산은 모델을 학습, 배포 및 관리하는 데 사용되며 버전을 관리하여 기록을 추적할 수 있습니다.
- 무엇보다도 컴퓨팅이 포함된 관리 섹션을 확인합니다. 이는 기계 학습 모델을 학습하거나 배포하는 데 필요한 인프라 리소스입니다.
AutoML을 사용하여 모델 학습
Azure Machine Learning 작업 영역에서 자산 및 리소스의 사용을 살펴보기 위해 모델을 학습시켜 보겠습니다.
데이터를 기반으로 작업에 가장 적합한 모델을 빠르게 학습하고 찾는 방법은 AutoML 옵션을 사용하는 것입니다.
참고: 스튜디오 전체를 안내하는 팝업이 전반적으로 나타날 수 있습니다. 모든 팝업을 닫아 무시하고 이 랩의 지침에 집중할 수 있습니다.
https://github.com/MicrosoftLearning/mslearn-azure-ml/raw/refs/heads/main/Labs/02/diabetes-data.zip
에서 사용할 학습 데이터를 다운로드하고 압축 파일을 추출합니다.- Azure Machine Learning 스튜디오로 돌아가서 스튜디오 왼쪽의 메뉴에서 AutoML 페이지를 선택합니다.
- +새 자동화된 ML 작업을 선택합니다.
- 기본 설정 단계에서 학습 작업에 고유한 이름을 지정하고 할당된 기본값을 실험하거나 사용합니다. 다음을 선택합니다.
- 작업 종류 및 데이터 단계에서 작업 종류로 분류를 선택하고, + 만들기를 선택하여 학습 데이터를 추가합니다.
- 데이터 자산 만들기 페이지의 데이터 형식 단계에서 데이터 자산에 이름을 지정하고(예:
training-data
) 다음을 선택합니다. - 데이터 원본 단계에서 로컬 파일에서를 선택하여 이전에 다운로드한 학습 데이터를 업로드합니다. 다음을 선택합니다.
- 대상 저장소 유형 단계에서 Azure Blob Storage가 데이터 저장소 유형으로 선택되어 있고 workspaceblobstore가 선택된 데이터 저장소인지 확인합니다. 다음을 선택합니다.
- MLTable 선택 단계에서 폴더 업로드를 선택하고, 이전에 다운로드한 압축 파일에서 압축을 푼 폴더를 선택합니다. 다음을 선택합니다.
- 데이터 자산의 설정을 검토하고 만들기를 선택합니다.
- 작업 종류 및 데이터 단계로 돌아가서 방금 업로드한 데이터를 선택하고 다음을 선택합니다.
팁: 다음 단계로 이동하기 전에 분류 작업 종류를 다시 선택해야 할 수도 있습니다.
- 작업 설정 단계에서 당뇨병(부울) 을 대상 열로 선택한 다음 추가 구성 설정 보기 옵션을 엽니다.
- 추가 구성 창에서 기본 메트릭을 정확도로 변경한 다음 저장을 선택합니다.
- 제한 옵션을 확장하고 다음 속성을 설정합니다.
- 최대 시도 횟수: 10
- 실험 시간 제한(분): 60
- 반복 시간 제한(분): 15
- 조기 종료 사용:
- 데이터 테스트에서 학습-테스트 분할을 선택하고 데이터의 백분율 테스트가 10인지 확인합니다. 다음을 선택합니다.
- 컴퓨팅 단계에서 컴퓨팅 유형이 서버리스이고 선택한 가상 머신 크기가 Standard_DS3_v2인지 확인합니다. 다음을 선택합니다.
참고: 컴퓨팅 인스턴스 및 클러스터는 표준 Azure 가상 머신 이미지를 기반으로 합니다. 이 연습에서는 비용과 성능의 최적의 균형을 맞추기 위해 Standard_DS3_v2 이미지를 권장합니다. 구독에 이 이미지를 포함하지 않는 할당량이 있는 경우 다른 이미지를 선택하세요. 하지만 이미지가 클수록 비용이 더 많이 들 수 있고 더 작은 이미지는 작업을 완료하기에 충분하지 않을 수 있습니다. 또는 Azure 관리자에게 할당량을 확장하도록 요청하세요.
- 모든 설정을 검토하고 학습 작업 제출을 선택합니다.
작업을 통해 기록 보기
작업을 제출하면 작업 페이지로 리디렉션됩니다. 작업을 사용하면 실행한 워크로드를 추적하고 서로 비교할 수 있습니다. 작업은 작업 실행을 그룹화할 수 있는 실험에 속합니다.
- 개요 매개 변수에서는 (무엇보다도) 작업의 상태, 만든 사람, 만든 시기, 실행에 걸린 시간 등을 확인할 수 있습니다.
-
학습 작업이 완료되려면 10-20분이 걸립니다. 작업이 완료되면 출력을 포함하여 각 개별 구성 요소 실행의 세부 정보도 볼 수 있습니다. 모델 학습 방법을 이해하려면 작업 페이지를 자유롭게 탐색해 보세요.
또한 Azure Machine Learning은 작업 속성을 자동으로 추적합니다. 작업을 사용하면 내역을 쉽게 확인하여 자신이나 동료가 이미 수행한 작업을 파악할 수 있습니다. 실험 중에 작업은 학습한 다양한 모델을 추적하여 최상의 모델을 비교하고 식별하는 데 도움이 됩니다. 프로덕션 중에 작업을 통해 자동화된 워크로드가 예상대로 실행되었는지 확인할 수 있습니다.
Azure 리소스 삭제
Azure Machine Learning 탐색을 마치면 지금까지 만든 리소스를 삭제하여 불필요한 Azure 비용을 방지해야 합니다.
- Azure Machine Learning 스튜디오 탭을 닫고 Azure Portal로 돌아갑니다.
- Azure Portal의 홈 페이지에서 리소스 그룹을 선택합니다.
- rg-dp100-labs 리소스 그룹을 선택합니다.
- 리소스 그룹의 개요 페이지에서 리소스 그룹 삭제를 선택합니다.
- 리소스 그룹 이름을 입력하여 삭제 의사를 확인한 다음 삭제를 선택합니다.