已启用 Arc 的 Azure AI 视频索引器 是一项已启用 Azure Arc 扩展的服务,可在边缘设备上运行视频和音频分析和 生成 AI 。 该解决方案在 已启用 Azure Arc 的 Kubernetes 上运行,支持许多视频格式,并假定一个视频索引器资源映射到一个扩展。 它用超过 35 种源语言转录口述内容,并将其翻译成英语。 有关支持语言的完整列表,请参阅 每个方案支持的语言。
本文将指导你完成在当前基础结构中将视频索引器作为 Arc 扩展启用所需的步骤。
先决条件
重要
若要成功部署 Azure AI 视频索引器扩展, 必须 提前批准 Azure 订阅 ID。 您必须先通过填写 限制访问服务申请表 来注册。
- 创建 Azure 订阅并向用户分配权限,以便他们可以创建 Azure 资源。
- 创建 Azure AI 视频索引器帐户。 有关创建帐户的详细信息,请参阅 “创建视频索引器帐户 ”教程。
- 创建 已启用 Arc 的 Kubernetes 群集。
若要使用视频索引器扩展,需要具有面向外部的终结点,该终结点可以是 DNS 名称或 IP 地址。 终结点应设置为安全传输协议(https:\\
),并用作扩展 API 终结点。 视频索引器 Web 门户也使用它来与扩展通信。 建议使用入口控件来管理终结点。
注意
如果终结点无法公开访问,则只能从本地网络通过门户网站对扩展执行操作。
本快速入门的最低硬件要求
本快速入门旨在使您能够查看扩展的实际应用。 建议在测试环境中使用较小规格的资源。 对于本快速入门,最低硬件要求如下:
- CPU:16 个核心
- 内存:16 GB
节点中的 CPU 应支持 AVX2。 大多数较新的 CPU 都支持该扩展,但在某些较旧的虚拟化环境中可能不受支持。
若要查看 生产 环境中的最低硬件要求,请参阅概述文章中的 最低硬件要求 。
最低软件要求
组件 | 最低要求 |
---|---|
操作系统 | Ubuntu 22.04 LTS 或任何 Linux 兼容 OS |
Kubernetes | 1.29 |
Azure 命令行接口 (CLI) | 2.64.0 |
参数定义
下面是用于配置扩展的参数表。
参数 | 说明 |
---|---|
release-namespace | 扩展安装到的 Kubernetes 命名空间 |
集群名称 | Kubernetes Azure Arc 实例名称 |
资源组 | Kubernetes Azure Arc 资源组名称 |
版本 | 视频索引器扩展版本,为最新保留空 |
videoIndexer.accountId | 视频索引器帐户 ID |
videoIndexer.endpointUri | 包含要用作扩展外部终结点的 DNS 名称或 IP 地址的 URL |
ViAi.gpu.enabled | 启用 GPU 进行摘要 |
ViAi.gpu.tolerations.key | 映射使用 GPU 运行摘要的节点。 约定设置为 nvidia.com/gpu |
ViAi.gpu.nodeSelector.workload | 标识为汇总选择的节点。 设置为 summarization 。 |
准备部署
在部署期间,脚本会要求获取特定于环境的值。 准备好这些值,以便在脚本要求它们时复制并粘贴它们。
问题 | 值 | 详细信息 |
---|---|---|
部署期间视频索引器帐户 ID 是什么? | GUID | 视频索引器帐户标识 |
部署期间 Azure 订阅 ID 是什么? | GUID | Azure 订阅 ID |
部署期间视频索引器资源组的名称是什么? | 字符串 | 视频索引器帐户的资源组名称 |
部署期间视频索引器帐户的名称是什么? | 字符串 | 视频索引器帐户名称 |
使用 Azure 门户进行部署
- 在 Azure 门户中,导航到 Azure Arc 连接的群集。
- 从菜单中选择“>>Azure AI 视频索引器 Arc 扩展”。
- 选择创建。 此时会显示 “创建 AI 视频索引器扩展” 屏幕。
- 在实例详细信息中配置扩展:
- 选择扩展的 订阅 和 资源组 。
- 选择 区域并连接 k8 群集。
- 输入扩展的名称。
- 选择扩展连接到的 Azure AI 视频索引器帐户 。
- 输入 群集终结点(IP 地址或用作 API 终结点的 DNS 名称)。
-
提供要用于 Kubernetes 分发支持的扩展的存储类。 例如,如果使用 AKS,则可以使用
azurefile-cli
。 有关 AKS 支持的预定义存储类的详细信息,请参阅 AKS 中的存储类。 如果使用的是其他 Kubernetes 发行版,请参阅 Kubernetes 发行版文档,了解支持的预定义存储类或你可以提供自己的存储类的方式。 - 选择一个生成式 AI 模型以应用 AI 功能,例如在由 Arc 启用的 VI 上进行文本摘要。有关详细信息,请参阅 Azure AI 视频索引器(VI)的生成式 AI。
- 选择“查看 + 创建”,然后选择“创建” 。
手动部署
使用示例部署脚本手动部署扩展。 在开始之前,请考虑“存储类型”。
存储类 - 视频索引器扩展要求存储卷必须在 Kubernetes 群集上可用。 存储类需要支持 ReadWriteMany
。 请务必注意,索引过程是 IO 密集型的,因此存储卷的 IOPS(每秒输入/输出作数)对进程的持续时间有显著影响。
重要
如果使用语言模型,则必须使用workload:summarization
标记节点或节点池。 标签是键值对,键是 workload
,值为 summarization
。 标有此标签的计算机必须至少有 32 个 CPU(用于生产),我们强烈建议它们是 Intel CPU(而不是 AMD)。
提示
阅读 有关如何将群集连接到 Azure Arc 的文章,了解该过程的完整演练。
可选配置
扩展默认设置设置为处理常见工作负荷,对于特定情况,可以使用以下参数来配置资源分配:
参数 | 默认 | 说明 |
---|---|---|
videoIndexer.webapi.resources.requests.cpu | 0.5 | Web API Pod 的请求核心数 |
videoIndexer.webapi.resources.requests.mem | 4Gi | Web API Pod 的请求内存容量 |
视频索引器.webapi.resources.limits.cpu | 1 | Web API Pod 的核心数限制 |
videoIndexer.webapi.resources.limits.mem | 6Gi | 限制 Web API Pod 的内存容量 |
storage.storageClass | "" | 要使用的存储类 |
存储.使用外部Pvc | 假 | 确定是否使用外部 PVC。 当为 true 时,VideoIndexer PVC 就不会被安装。 |
scaling.ai.maxReplicaCount | 20 | 设置 AI 工作负载最大 Pod 规模(不包括汇总) |
后续步骤
查看由 Arc 启用的 Azure AI 视频索引器 示例。