你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure AI 内容理解中的预构建分析器

Azure AI 内容理解预生成分析器是现成的工具,旨在简化常见的内容处理任务。 它们支持用于搜索和检索扩充生成(RAG)工作流的内容引入,以及用于从发票中提取数据或分析呼叫中心记录的智能文档处理(IDP)等方案。 还可以 自定义这些分析器 以提取更多字段或优化输出,以更好地满足特定的工作流要求。

用于内容引入的预构建分析器

Azure AI 内容理解提供预建的分析器,这些分析器按布局提取原始内容并转换为 markdown 格式,同时执行基本的语义分析,从而简化常见的内容摄取任务。 这些功能增强了下游应用程序的检索质量,例如检索扩充生成(RAG)。

prebuilt-documentAnalyzer
  • 从文档和图像中提取文本和布局详细信息。
  • 生成文档内容的简明摘要。
prebuilt-imageAnalyzer
  • 为图像生成描述性标题。
prebuilt-audioAnalyzer
  • 从音频文件中提取文字记录。
  • 执行说话人分割以区分不同的说话人。
  • 提供音频内容的摘要。
prebuilt-videoAnalyzer
  • 从视频文件中提取转录文本。
  • 标识关键帧和相机镜头。
  • 将视频划分为有意义的部分。
  • 为每个视频段生成摘要。

用于智能文档处理的预构建分析器

内容理解还包括专为专用行业方案设计的预生成分析器,支持从发票中提取结构化数据,并分析呼叫中心脚本。

prebuilt-invoice
  • 从文档和图像中提取文本,并将文档布局转换为Markdown格式。
  • 从发票中提取结构化数据,包括发票编号、日期、供应商、总金额和行项。 支持各种发票格式和语言,用于应付账款流程和相关场景的自动数据捕获。
prebuilt-callCenter
  • 从音频文件中提取转录内容。
  • 区分说话人并将其分配给客户或代理角色。
  • 分析呼叫中心脚本以生成摘要、确定客户情绪、识别讨论主题等。

后续步骤