使用 MLflow 追蹤筆記本中的模型定型

您通常會藉由實驗和定型多個模型來開始新的資料科學專案。 若要追蹤您的工作並保存您定型的模型及其執行方式的概觀,您可以使用 MLflow 追蹤。

在此練習中,您會在計算實例上執行的筆記本內使用 MLflow 來記錄模型定型。

在您開始使用 Intune 之前

您將需要具有系統管理層級存取權的 Azure 訂用帳戶

佈建 Azure Machine Learning 工作區

Azure Machine Learning 工作區** 會提供一個集中位置,用來管理您定型和管理模型所需的所有資源和資產。 您可以透過 Studio、Python SDK 和 Azure CLI 與 Azure Machine Learning 工作區互動。

您將使用 Azure CLI 來佈建工作區和必要的計算,並使用 Python SDK 使用自動化機器學習來定型分類模型。

建立工作區和計算資源

若要建立 Azure Machine Learning 工作區和計算執行個體,您可使用 Azure CLI。 所有必要的命令會在殼層指令碼中進行分組,以供您執行。

  1. 在瀏覽器中,開啟位於 https://portal.azure.com/ 的 Azure 入口網站,並使用您的 Microsoft 帳戶登入。
  2. 選取頁面頂端搜尋方塊右邊的 [>_] (Cloud Shell) 按鈕。 這會在入口網站底部開啟 Cloud Shell 窗格。
  3. 若系統詢問,請選取 [Bash]**。 第一次開啟 Cloud Shell 時,系統會要求您選擇要使用的殼層類型 ([Bash] 或 [PowerShell]**)。
  4. 檢查是否已指定正確的訂用帳戶,並 選取 [不需要 記憶體帳戶]。 選取套用
  5. 在終端機中,輸入下列命令來複製此存放庫:

     rm -r azure-ml-labs -f
     git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
    

    使用 SHIFT + INSERT 將複製的程式碼貼入 Cloud Shell 中。

  6. 在複製了存放庫之後,請輸入下列命令以變更為此實驗室的資料夾,並執行其所包含的 setup.sh 指令碼:

     cd azure-ml-labs/Labs/07
     ./setup.sh
    

    忽略表明未安裝延伸模組的任何 (錯誤) 訊息。

  7. 等候指令碼完成 - 這通常需要大約 5-10 分鐘的時間。

    疑難解答提示:工作區建立錯誤

    如果您在透過 CLI 執行安裝文稿時收到錯誤,您需要手動佈建資源:

    1. 在 Azure 入口網站 首頁中,選取 [+建立資源]。
    2. 搜尋機器學習服務,然後選取 [Azure 機器學習]。 選取 建立
    3. 使用下列設定建立新的 Azure Machine Learning 資源:
      • 訂用帳戶:您的 Azure 訂用帳戶
      • 資源群組:rg-dp100-labs
      • 工作區名稱:mlw-dp100-labs
      • 區域選取最接近您所在位置的地理區域
      • 儲存體帳戶:記下將為您的工作區建立的預設新儲存體帳戶
      • 金鑰保存庫:記下將為您的工作區建立的預設新金鑰保存庫
      • Application Insights:記下將為您的工作區建立的預設新 Application Insights 資源
      • 容器登錄:無 (在您第一次將模型部署到容器時,系統將會自動建立一個)
    4. 選取 [檢閱 + 建立 ],並等候工作區及其相關聯的資源建立 - 這通常需要大約 5 分鐘的時間。
    5. 選取 [移至資源],然後在其 [概觀] 頁面中,選取 [啟動工作室]。 另一個索引標籤將在瀏覽器中開啟,以開啟 Azure Machine Learning 工作室。
    6. 關閉在工作室中出現的任何快顯視窗。
    7. 在 Azure Machine Learning 工作室 內,流覽至 [計算] 頁面,然後選取 [計算實例] 索引卷標下的 [+新增]。
    8. 為計算實例指定唯一的名稱,然後選取 Standard_DS11_v2 做為虛擬機大小。
    9. 選取 [檢閱 + 建立],然後選取 [建立]
    10. 接下來,選取 [ 計算叢集] 索引標籤 ,然後選取 [ + 新增]。
    11. 選擇與您建立工作區所在的區域相同,然後選取 [Standard_DS11_v2 ] 作為虛擬機大小。 選取下一個
    12. 為叢集提供唯一的名稱,然後選取 [ 建立]。
    13. </ol> </details>

複製實驗室材料

當您建立了工作區和必要的計算資源時,您可以開啟 Azure Machine Learning 工作室,並將實驗室材料複製到工作區。

  1. 在 Azure 入口網站中,瀏覽至名為 mlw-dp100-… 的 Azure Machine Learning 工作區。
  2. 選取 Azure Machine Learning 工作區,然後在其 [概觀]** 頁面中,選取 [啟動工作室]**。 另一個索引標籤將在瀏覽器中開啟,以開啟 Azure Machine Learning 工作室。
  3. 關閉在工作室中出現的任何快顯視窗。
  4. 在 Azure Machine Learning 工作室中,瀏覽至 [計算]** 頁面,並確認您在上一節中建立的計算執行個體是否存在。 計算執行個體應該正在執行。
  5. 在 [計算執行個體]** 索引標籤中,尋找您的計算執行個體,然後選取 [終端]** 應用程式。
  6. 在終端中,執行下列命令,即可在計算執行個體上安裝 Python SDK 和 MLflow:

     pip uninstall azure-ai-ml
     pip install azure-ai-ml
     pip install mlflow
    

    忽略任何表示找不到套件且已解除安裝的 (錯誤) 訊息。

  7. 輸入下列命令,將包含筆記本、資料和其他檔案的 Git 存放庫複製到您的工作區:

     git clone https://github.com/MicrosoftLearning/mslearn-azure-ml.git azure-ml-labs
    
  8. 命令完成後,按一下 [檔案] 窗格中的 [↻] 以重新整理檢視,並驗證是否已建立新的 /users/your-user-name/azure-ml-labs 資料夾。

使用 MLflow 追蹤模型定型

由於您已擁有所有必要的資源,您即可在於筆記本中定型模型時執行筆記本來設定及使用 MLflow。

  1. 開啟使用 MLflow.ipynb 的 Labs/07/Track 模型定型筆記本。

    選取 [驗證],如果出現要求您進行驗證的通知,請依照必要的步驟進行。

  2. 確認筆記本使用 Python 3.10 - AzureML 核心。
  3. 執行筆記本中的所有儲存格。
  4. 檢閱每次定型模型時所建立的新作業。

    注意: 當您定型模型時,單元格的輸出會顯示作業執行的連結。 如果連結傳回錯誤,您仍然可以選取 左側面板中的 [作業 ] 來檢閱作業執行。

刪除 Azure 資源

當您完成探索 Azure Machine Learning 時,應該刪除您所建立的資源,以避免產生不必要的 Azure 成本。

  1. 關閉 [Azure Machine Learning 工作室] 索引標籤,然後返回 Azure 入口網站。
  2. 在 Azure 入口網站的 [首頁]** 上,選取 [資源群組]**。
  3. 選取 rg-dp100-… 資源群組。
  4. 在資源群組的 [概觀]** 頁面頂端,選取 [刪除資源群組]**。
  5. 輸入資源群組名稱以確認要刪除,然後選取 [刪除]**