ラボ 1: 演習 3: トレーニング可能な分類器を管理する

Contoso Ltd. は、高度なドローン技術に重点を置いた Mark8 プロジェクトの研究開発 (R&D) に携わっています。 この会社は、このプロジェクトに関連する機密情報を適切に分類して、不正アクセスや共有を防止する必要があります。 このラボでは、Mark8 プロジェクトに関連するドキュメントを識別してラベル付けするためのトレーニング可能な分類子を作成します。 現在のデータセットの制限により、Contoso には分類子を完全にトレーニングするための関連ドキュメントの十分な例がない可能性があります。 この演習では、分類子の精度を向上させるために、多様で包括的なデータ サンプルを使用することの重要性を強調します。

[! 警告] このトレーニング テナントで使用できるデータは限られているため、このラボのトレーニング可能な分類子作成プロセスでは、成功した分類結果は得られません。 この演習は、トレーニング可能な分類子を構成する際の対話型エクスペリエンスを提供するように設計されており、セットアップ プロセスとレビュー プロセスを調べることができます。 分類子はデータを想定どおりに完全にトレーニングして分類することはありませんが、この演習では、効果的な分類子トレーニングに必要なワークフローと考慮事項に関する分析情報を提供します。

タスク 1 – トレーニング可能な分類子を作成する

このタスクでは、トレーニング可能な分類子を設定して、Contoso Ltd 内の Mark8 プロジェクトに関連する機密ドキュメントを識別して保護します。

  1. Client 1 VM (LON-CL1) には lon-cl1\admin アカウントでログインし、Microsoft 365 には Joni Sherman としてログインしておく必要があります。

  2. Microsoft Edge で、 https://compliance.microsoft.com に移動します。

  3. 左側のナビゲーション ウィンドウで [データ分類] を展開し、[分類子] を選択します。

  4. [分類子] ページで、[トレーニング可能な分類子] タブが既に選択されている必要があります。

  5. [+ トレーニング可能な分類器を作成する] を選択し、新しい分類器を作成します。

  6. [トレーニング可能な分類器の名前と説明] ページで次の情報を入力します。

    • 名前: Mark8 Project Documents
    • 説明: Classifier for identifying sensitive documents related to the Mark8 drone project's research and development efforts.
  7. [次へ] を選択します。

  8. [正のサンプル コンテンツのソース] で、[ + サイトの選択] を選択します。

  9. 右側のSharePoint サイトの追加のポップアップ ページで、次の SharePoint サイトを選択します。

    • Mark8ProjectTeam
  10. ポップアップ ページの下部にある [追加] を選択します。

  11. [正のサンプル コンテンツのソース] ページに戻り [次へ] を選択します。

  12. [負のサンプル コンテンツの ソース] ページで、次の SharePoint サイトを選択します。

    • HR
  13. ポップアップ ページの下部にある [追加] を選択します。

  14. [負のサンプル コンテンツのソース] ページに戻り [次へ] を選択します。

  15. [分類子をレビューして作成しサンプル コンテンツの処理を開始する][トレーニング可能な分類子の作成] を選択します。

  16. [分類子のトレーニング中です] ページで、[Done] を選択します。

選択した SharePoint サイトのドキュメントとファイルは現在分析されています。分析には最大で48 時間かかります。

タスク 2 - 分類子の結果を確認する

Joni は、トレーニング可能な分類子を構成しているにもかかわらず、期待される結果が生成されなかったことに気付きました。 このタスクでは、トレーニング可能な分類子の結果を確認して、意図したコンテンツが正常に分類されなかった理由を理解します。特に、トレーニングサンプルの不足や不一致などの問題に焦点を当てます。

  1. ポータルの [分類子] ページで、引き続き Microsoft Purview にログインしている必要があります。 Microsoft 365 に Joni Sherman としてログインする必要があります。

  2. [公開済み] の横にある下矢印を選択して、公開されたトレーニング可能な分類子を折りたたみ、トレーニング中の分類子を識別しやすくします。

  3. [Mark8 プロジェクト ドキュメント] には、トレーニングが完了するまで処理中の状態が表示されます。

  4. トレーニングが完了すると、分類子はトレーニングに失敗しましたに更新されます。

  5. この分類子が失敗した理由を理解するには、矢印が表示されたウィンドウのアイコンを選択して 新しいウィンドウで開きます

  6. [Mark8 プロジェクト ドキュメント] 分類子ウィンドウで、[概要] タブと [テスト結果の確認] タブを確認して、この分類子が失敗した理由を理解します。

  7. テスト結果を確認すると、サンプル データに多数の擬陽性および偽陰性が表示されます。

  8. この分類子を削除するには、Mark8 プロジェクト ドキュメントページの右上にある [削除] ボタンを選択します。

これで、トレーニング可能な分類子の結果のレビューが完了しました。 このプロセスでは、分類を成功させるために十分かつ正しく調整されたトレーニング サンプルの重要性が強調されました。 分類子の障害の原因を理解することで、将来の構成に備え、より正確で信頼性の高いデータ分類を確保できます。