你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是视频检索?

重要

2025 年 6 月 30 日,Azure AI 视觉视频检索将停用。 停用此功能的决定是我们不断改进和简化和改进为视频处理提供的功能的一部分。 迁移到 Azure AI 内容理解和 Azure AI 搜索,从其附加功能中受益。

视频处理:视频检索与 Azure AI 内容理解

功能 用于视频描述的视频检索 Azure AI 内容解析
支持的视频长度 针对短视频进行优化,最多 3 分钟 支持短视频和长视频,最多 4 小时
帧处理 最多 20 帧 批处理,对整个视频逐帧进行采样。
内容提取预处理 转录 听录、镜头识别、人脸分组
结构化输出支持 不支持 支持符合架构的结构化输出
数据类型 支持的视频 支持的视频、图像、文档和语音
定价 基于令牌的变量 已处理视频每分钟固定成本

若要迁移到视频摘要和说明的内容理解,建议查看 Azure AI 内容理解文档。

视频搜索:视频检索与 Azure AI 搜索和内容理解

功能 用于视频搜索的视频检索 Azure AI 搜索和内容理解
视觉嵌入类型 基于帧的图像嵌入 视频描述文本嵌入
内容提取预处理 转录,OCR 听录、镜头识别、人脸分组
人员与对象搜索支持 大力支持 大力支持
行动和事件支持 受限制 大力支持
自定义 没有 可以通过使用字段和字段说明来定制内容理解分析器,以便更好地聚焦

若要开始使用内容理解构建搜索用例,建议从 此示例 开始,此示例演示如何使用 Azure AI 搜索来搜索视频。

为了避免服务中断,请在 2025 年 6 月 30 日前迁移。

视频检索是一项服务,可用于创建搜索索引、向其添加文档(视频和图像)以及使用自然语言进行搜索。 开发人员可以为每个索引定义元数据架构,并将元数据引入服务以帮助检索。 开发人员还可以指定要从索引中提取哪些功能(视觉、语音),并根据功能筛选其搜索。

输入要求

支持的格式

文件格式 说明
asf ASF(高级/主动流格式)
avi AVI(音频视频交错)
flv FLV(闪存视频)
matroskammwebm Matroska/WebM
mov,mp4m4a,3gp,3g2,mj2 QuickTime/MOV

支持的视频编解码器

编解码器 格式
h264 H.264 / AVC / MPEG-4 AVC / MPEG-4 第 10 部分
h265 H.265/HEVC
libvpx-vp9 libvpx VP9(编解码器 vp9)
mpeg4 MPEG-4 第 2 部分

支持的音频编解码器

编解码器 格式
aac AAC(高级音频编码)
mp3 MP3(运动图像专家组音频层面 3)
pcm PCM(解压缩)
vorbis Vorbis
wmav2 Windows Media Audio 2