Azure Machine Learning 작업 영역 살펴보기
Azure Machine Learning은 Machine Learning 모델을 학습하고 관리하기 위한 데이터 과학 플랫폼을 제공합니다. 이 랩에서는 Azure Machine Learning 작업 영역을 만들어 사용하는 다양한 방법을 살펴봅니다. 이 랩은 Azure Machine Learning 및 개발자 도구의 다양한 핵심 기능을 소개하도록 설계되었습니다. 기능에 대해 더 자세히 알아보려면 다른 랩을 살펴봅니다.
시작하기 전에
관리 수준 액세스 권한이 있는 Azure 구독이 필요합니다.
Azure Machine Learning 작업 영역 프로비저닝
Azure Machine Learning 작업 영역은 모델을 학습하고 관리하는 데 필요한 모든 리소스 및 자산을 관리하기 위한 중심지를 제공합니다.** Azure Portal의 대화형 인터페이스를 사용하여 작업 영역을 프로비전하거나 Azure Machine Learning 확장과 함께 Azure CLI를 사용할 수 있습니다. 대부분의 프로덕션 시나리오에서는 리소스 배포를 반복 가능한 개발 및 운영(DevOps) 프로세스에 통합할 수 있도록 CLI를 사용하여 프로비전을 자동화하는 것이 가장 좋습니다.
이 연습에서는 Azure Portal을 사용하여 Azure Machine Learning을 프로비전하고 모든 옵션을 살펴봅니다.
https://portal.azure.com/
에 로그인합니다.- 다음 설정을 사용하여 새 Azure Machine Learning 리소스를 만듭니다.
- 구독: ‘Azure 구독’
- 리소스 그룹:
rg-dp100-labs
- 작업 영역 이름:
mlw-dp100-labs
- 지역: ‘지리적으로 가장 가까운 지역 선택’**
- 스토리지 계정: ‘작업 영역에 대해 만들 새로운 기본 스토리지 계정’
- 키 자격 증명 모음: ‘작업 영역에 대해 만들 새로운 기본 키 자격 증명 모음’
- Application insights: ‘작업 영역에 대해 만들 새로운 기본 Application Insights 리소스’
- 컨테이너 레지스트리: 없음(‘처음으로 컨테이너에 모델을 배포할 때 자동으로 만들어짐’)
- 작업 영역 및 관련 리소스가 만들어질 때까지 기다립니다. 일반적으로 약 5분 정도 걸립니다.
참고: Azure Machine Learning 작업 영역을 만들 때는 몇 가지 고급 옵션을 사용하여 프라이빗 엔드포인트를 통한 액세스를 제한하고 데이터 암호화용 사용자 지정 키를 지정할 수 있습니다. 이 연습에서는 이러한 옵션을 사용하지 않지만 그러한 옵션이 있다는 것은 기억해 두어야 합니다.
Azure Machine Learning 스튜디오 살펴보기
Azure Machine Learning 스튜디오는 Azure Machine Learning 작업 영역에 액세스할 수 있는 웹 기반 포털입니다. Azure Machine Learning 스튜디오를 사용하여 작업 영역 내의 모든 자산과 리소스를 관리할 수 있습니다.
- rg-dp100-labs라는 리소스 그룹으로 이동합니다.
- 리소스 그룹에 Azure Machine Learning 작업 영역, Application Insights, Key Vault 및 스토리지 계정이 포함되어 있는지 확인합니다.
- Azure Machine Learning 작업 영역을 선택합니다.
- 개요 페이지에서 스튜디오 시작을 선택합니다. Azure Machine Learning 스튜디오를 열 수 있는 또 다른 탭이 브라우저에 열립니다.
- 스튜디오에 나타나는 팝업을 모두 닫으세요.
- 스튜디오 왼쪽에 표시된 다양한 페이지를 참고합니다. 메뉴에 기호만 표시되는 경우 ☰ 아이콘을 클릭하면 메뉴를 확장하고 페이지 이름을 탐색할 수 있습니다.
- Notebooks, 자동화된 ML 및 디자이너가 포함된 작성 섹션을 확인합니다. Azure Machine Learning 스튜디오 내에서 고유한 Machine Learning 모델을 만들 수 있는 세 가지 방법이 있습니다.
- 무엇보다도 데이터, 작업 및 모델을 포함하는 자산 섹션을 확인합니다. 모델을 학습하거나 채점할 때 자산이 사용되거나 만들어집니다. 자산은 모델을 학습, 배포 및 관리하는 데 사용되며 버전을 관리하여 기록을 추적할 수 있습니다.
- 무엇보다도 컴퓨팅이 포함된 관리 섹션을 확인합니다. 이는 기계 학습 모델을 학습하거나 배포하는 데 필요한 인프라 리소스입니다.
학습 파이프라인 작성
Azure Machine Learning 작업 영역에서 자산 및 리소스의 사용을 살펴보기 위해 모델을 학습시켜 보겠습니다.
모델 학습 파이프라인을 작성하는 빠른 방법은 디자이너를 사용하는 것입니다.
참고: 스튜디오 전체를 안내하는 팝업이 전반적으로 나타날 수 있습니다. 모든 팝업을 닫아 무시하고 이 랩의 지침에 집중할 수 있습니다.
- 스튜디오 왼쪽 메뉴에서 디자이너 페이지를 선택합니다.
-
회귀 - 자동차 가격 예측(기본) 샘플을 선택합니다.
새 파이프라인이 나타납니다. 파이프라인 상단에는 자동차 가격 데이터(원시) 를 로드하는 구성 요소가 표시됩니다. 이 파이프라인은 데이터를 처리하고 선형 회귀 모델을 학습하여 각 자동차의 가격을 예측합니다.
- 페이지 상단에서 구성 및 제출을 선택하여 파이프라인 작업 설정 대화 상자를 엽니다.
- 기본 사항 페이지에서 새로 만들기를 선택하고 실험 이름을
train-regression-designer
로 설정한 후 다음을 선택합니다. - 입력 및 출력 페이지에서 변경하지 않고 다음을 선택합니다.
- 런타임 설정 페이지에서 파이프라인을 실행할 기본 컴퓨팅이 없으면 오류가 표시됩니다.
컴퓨팅 대상을 만들어 보겠습니다.
컴퓨팅 대상 만들기
Azure Machine Learning 작업 영역 내에서 워크로드를 실행하려면 컴퓨팅 리소스가 필요합니다. Azure Machine Learning의 이점 중 하나는 실험 및 학습 스크립트를 대규모로 실행할 수 있는 클라우드 기반 컴퓨팅 리소스를 만들 수 있는 기능입니다.
- Azure Machine Learning 스튜디오의 왼쪽 메뉴에서 컴퓨팅 페이지를 선택합니다. 사용할 수 있는 컴퓨팅 리소스에는 네 가지 종류가 있습니다.
- 컴퓨팅 인스턴스: Azure Machine Learning에서 관리되는 가상 머신입니다. 데이터를 탐색하고 기계 학습 모델을 반복적으로 실험할 때 개발에 적합합니다.
- 컴퓨팅 클러스터: 실험 코드 주문형 처리용 가상 머신의 확장 가능한 클러스터입니다. 프로덕션 코드 또는 자동화된 작업을 실행하는 데 적합합니다.
- Kubernetes 클러스터: 학습 및 채점에 사용되는 Kubernetes 클러스터입니다. 대규모 실시간 모델 배포에 적합합니다.
- 연결된 컴퓨팅: Virtual Machines 또는 Azure Databricks 클러스터와 같은 작업 영역에 기존 Azure 컴퓨팅 리소스를 연결합니다.
디자이너로 작성한 기계 학습 모델을 학습하려면 컴퓨팅 인스턴스 또는 컴퓨팅 클러스터를 사용할 수 있습니다.
- 컴퓨팅 인스턴스 탭에서 다음 설정을 사용하여 새 컴퓨팅 인스턴스를 추가합니다.
- 컴퓨팅 이름: 고유한 이름 입력**
- 위치: 자동으로 작업 영역과 동일한 위치
- 가상 머신 유형:
CPU
- 가상 머신 크기:
Standard_DS11_v2
- 사용 가능한 할당량: 사용 가능한 전용 코어를 표시합니다.
- 고급 설정 표시: 다음 설정을 확인만 하고 선택하지는 않습니다.
- SSH 액세스 사용:
Unselected
(SSH 클라이언트를 사용하여 가상 머신에 직접 액세스할 수 있음) - 가상 네트워크 사용:
Unselected
(일반적으로 엔터프라이즈 환경에서 네트워크 보안을 강화할 수 있음) - 다른 사용자에게 할당:
Unselected
(데이터 과학자에게 컴퓨팅 인스턴스를 할당할 수 있음) - 설정 스크립트로 프로비전:
Unselected
(만들 때 원격 인스턴스에서 실행할 스크립트를 추가할 수 있음) - 관리 ID 할당:
Unselected
(시스템 할당 또는 사용자 할당 관리 ID를 연결하여 리소스에 대한 액세스 권한을 부여할 수 있음)
- SSH 액세스 사용:
- 만들기를 선택하고 컴퓨팅 인스턴스가 시작되고 상태가 실행 중으로 바뀔 때까지 기다립니다.
참고: 컴퓨팅 인스턴스 및 클러스터는 표준 Azure 가상 머신 이미지를 기반으로 합니다. 이 연습에서는 비용과 성능 간 최적의 균형을 달성하기 위해 Standard_DS11_v2 이미지를 사용하는 것이 좋습니다. 구독에 이 이미지를 포함하지 않는 할당량이 있는 경우 다른 이미지를 선택하세요. 하지만 이미지가 클수록 비용이 더 많이 들 수 있고 더 작은 이미지는 작업을 완료하기에 충분하지 않을 수 있습니다. 또는 Azure 관리자에게 할당량을 확장하도록 요청하세요.
학습 파이프라인 실행
컴퓨팅 대상을 만들었으며 이제 디자이너에서 샘플 학습 파이프라인을 실행할 수 있습니다.
- 디자이너 페이지로 이동합니다.
- 회귀 - 자동차 가격 예측(기본) 파이프라인 초안을 선택합니다.
- 페이지 상단에서 구성 및 제출을 선택하여 파이프라인 작업 설정 대화 상자를 엽니다.
- 기본 사항 페이지에서 새로 만들기를 선택하고 실험 이름을
train-regression-designer
로 설정한 후 다음을 선택합니다. - 입력 및 출력 페이지에서 변경하지 않고 다음을 선택합니다.
- 런타임 설정의 컴퓨팅 형식 선택 드롭다운에서 컴퓨팅 인스턴스를 선택하고 Azure ML 컴퓨팅 인스턴스 선택 드롭다운에서 아래에서 새로 만들어진 컴퓨팅 인스턴스를 선택합니다.
- 검토 + 제출을 선택하여 파이프라인 작업을 검토한 다음 제출을 선택하여 학습 파이프라인을 실행합니다.
이제 학습 파이프라인이 컴퓨팅 인스턴스에 제출됩니다. 파이프라인이 완료될 때까지 약 10분 정도 걸립니다. 그동안 다른 페이지를 살펴보겠습니다.
작업을 통해 기록 보기
Azure Machine Learning 작업 영역에서 스크립트나 파이프라인을 실행할 때마다 이는 작업으로 기록됩니다. 작업을 사용하면 실행한 워크로드를 추적하고 서로 비교할 수 있습니다. 작업은 작업 실행을 그룹화할 수 있는 실험에 속합니다.
- Azure Machine Learning 스튜디오 왼쪽에 있는 메뉴를 사용하여 작업 페이지로 이동합니다.
- 작업 실행을 보려면 train-regression-designer 실험을 선택합니다. 여기에서는 이 실험에 포함된 모든 작업의 개요를 볼 수 있습니다. 여러 학습 파이프라인을 실행한 경우 이 보기를 사용하면 파이프라인을 비교하고 가장 적합한 파이프라인을 식별할 수 있습니다.
- train-regression-designer 실험에서 마지막 작업을 선택합니다.
- 어떤 구성 요소가 성공적으로 실행되었거나 실패했는지 볼 수 있는 학습 파이프라인이 표시됩니다. 작업이 계속 실행 중인 경우 현재 실행 중인 작업도 식별할 수 있습니다.
- 파이프라인 작업 세부 정보를 보려면 오른쪽 상단의 작업 개요를 선택하여 파이프라인 작업 개요를 확장합니다.
-
개요 매개 변수에서는 작업 상태, 파이프라인을 만든 사용자, 만든 시기, 전체 파이프라인을 실행하는 데 걸린 시간 등을 확인할 수 있습니다.
스크립트나 파이프라인을 작업으로 실행하면 입력을 정의하고 출력을 문서화할 수 있습니다. 또한 Azure Machine Learning은 작업 속성을 자동으로 추적합니다. 작업을 사용하면 내역을 쉽게 확인하여 자신이나 동료가 이미 수행한 작업을 파악할 수 있습니다.
실험 중에 작업은 학습한 다양한 모델을 추적하여 최상의 모델을 비교하고 식별하는 데 도움이 됩니다. 프로덕션 중에 작업을 통해 자동화된 워크로드가 예상대로 실행되었는지 확인할 수 있습니다.
- 작업이 완료되면 출력을 포함하여 각 개별 구성 요소 실행의 세부 정보도 볼 수 있습니다. 모델 학습 방법을 이해하려면 파이프라인을 자유롭게 탐색해 보세요.
Azure 리소스 삭제
Azure Machine Learning 탐색을 마치면 지금까지 만든 리소스를 삭제하여 불필요한 Azure 비용을 방지해야 합니다.
- Azure Machine Learning 스튜디오 탭을 닫고 Azure Portal로 돌아갑니다.
- Azure Portal의 홈 페이지에서 리소스 그룹을 선택합니다.
- rg-dp100-labs 리소스 그룹을 선택합니다.
- 리소스 그룹의 개요 페이지에서 리소스 그룹 삭제를 선택합니다.
- 리소스 그룹 이름을 입력하여 삭제 의사를 확인한 다음 삭제를 선택합니다.