你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

内容理解分类器

重要

借助 Azure AI 内容理解分类器，可以检测和识别应用程序中处理的文档。内容理解分类器可以对整个输入文件执行分类，或者识别输入文件中单个文档的多个文档或多个实例。

业务用例

分类器可以处理各种格式和模板的复杂文档：

内容理解分类器可以分析单文件或多文件文档，以确定输入文件是否可以分类为定义的类别。以下是当前支持的情况：

内容理解分类器不需要任何训练数据集。定义最多 50 个类别名称和说明，并创建分类器。默认情况下，整个文件被视为单个内容对象，这意味着文件/对象与单个类别相关联。

但是，如果文件中有多个文档，分类器可以使用拆分功能标识输入文件中包含的不同文档类型。分类器响应包含识别到的包含在某个文件中的每种文档类型的页范围。此响应可以包含同一文档类型的多个实例。

调用分类器时，analyze操作包括一个splitMode属性，该属性提供对拆分行为的精细控制。还可以指定页码以仅分析输入文档的某些页面。

对于完整的端到端流，可以将分类器类别与现有分析器链接。对于使用链接分析器分类为类别的每个内容对象，该服务将使用相应的分析器自动调用对内容对象的分析。例如，此链接可用于创建分类器，该分类器仅从 PDF 中识别和分析可能包含多种类型的表单的发票。

有关支持的输入文档格式和分类器限制的信息，请参阅我们的服务配额和限制页。

为了提高分类和拆分质量，必须提供良好的类别名称和说明，以便模型可以了解具有某些上下文的类别。有关类别名称和说明的详细信息， 请参阅最佳做法。

有关支持的语言和区域的详细列表，请访问我们的语言和区域支持页面。

使用内容理解的开发人员应查看 Microsoft 有关客户数据的策略。有关详细信息，请访问我们的“数据、保护和隐私”页面。