实验室 1 - 练习 3 - 管理可训练的分类器

Contoso Ltd. 正在开展其 Mark8 项目的研发 (R&D),该项目专注于先进的无人机技术。 该公司需要确保与此项目相关的敏感信息已正确分类,以防止未经授权的访问或共享。 在此实验室中,你将创建一个可训练的分类器,该分类器旨在标识和标记与 Mark8 项目关联的文档。 由于当前数据集的限制,Contoso 可能没有足够的相关文档示例来充分训练分类器。 本练习将重点介绍具有多样化且全面的数据样本以提高分类器准确性的重要性。

[!alert] 由于此训练租户中提供的数据有限,本实验室中可训练分类器的创建过程不会获得成功的分类结果。 本练习旨在提供配置可训练分类器的交互式体验,让你能够探索设置和评审过程。 虽然分类器不会按预期充分训练并分类数据,但该练习提供了对有效分类器训练所需的工作流和注意事项的见解。

任务 1 – 创建可训练的分类器

在此任务中,你将设置可训练的分类器,以识别和保护与 Contoso Ltd 中的 Mark8 项目相关的敏感文档。

  1. 仍应使用 LON-CL1\admin 帐户登录到客户端 1 VM (LON-CL1),并且应该以 Joni Sherman 帐户登录到 Microsoft 365。********

  2. 在“Microsoft Edge”中,导航到 https://compliance.microsoft.com

  3. 在左侧导航窗格中,展开“数据分类”,然后选择“分类器”。********

  4. 在“分类器”页上,应已选择“可训练分类器”的选项卡。********

  5. 选择“+ 创建可训练的分类器”以新建分类器。

  6. 在“命名和描述可训练的分类器”**** 页中输入:

    • 名称Mark8 Project Documents
    • 说明Classifier for identifying sensitive documents related to the Mark8 drone project's research and development efforts.
  7. 选择下一步

  8. 在“正面示例内容来源”**** 上,选择“+选择网站”****。

  9. 在右侧的“添加 SharePoint 网站”弹出页面中,选择以下 SharePoint 网站:****

    • Mark8ProjectTeam
  10. 选择弹出页面底部的“添加”。****

  11. 返回“正面示例内容来源”页,选择“下一步”。********

  12. 在“负面示例内容来源”页上,选择以下 SharePoint 网站:****

    • HR
  13. 选择弹出页面底部的“添加”。****

  14. 返回“负面示例内容来源”页,选择“下一步”。********

  15. 查看和创建分类器以开始处理示例内容上,选择创建可训练的分类器

  16. 在“正在训练分类器”页上,选择“完成”。********

现在,正在分析所选 SharePoint 网站中的文档和文件,可能需要长达 24 个小时。

任务 2 - 查看分类器结果

Joni 注意到,尽管配置了可训练的分类器,但分类器并没有产生预期的结果。 在此任务中,你将查看可训练分类器的结果,以了解它为何未能成功分类预期内容,其中将重点关注潜在问题,如训练样本不足或未对齐。

  1. 你仍然应该在门户的“分类器”**** 页上登录到 Microsoft Purview。 你应该以 Joni Sherman**** 的身份登录到 Microsoft 365。

  2. 选择“已发布”**** 旁边的向下箭头以折叠已发布的可训练分类器,从而更易于识别正在训练的分类器。

  3. “Mark8 项目文档”**** 将显示“正在进行”**** 状态,直到训练完成。

  4. 训练完成后,分类器将更新为“训练失败”状态****。

  5. 要了解此分类器为何失败,请选择带箭头的窗口图标,以“在新窗口中打开”****。

  6. Mark8 项目文档分类器窗口中,查看概述查看测试结果选项卡,以了解此分类器失败的原因。

  7. 在查看测试结果时,示例数据中会出现许多“误报”**** 和“漏报”****。

  8. 要移除此分类器,请选择“Mark8 项目文档”**** 页右上角的“删除”**** 按钮。

现已完成可训练分类器结果的评审。 此过程强调了数量足够且正确对齐的训练样本对于成功完成分类的重要性。 通过了解分类器失败的原因,可以为将来的配置做好更充分的准备,确保数据分类更加准确、可靠。