尝试通过 Arc 启用 Azure AI 视频索引器

已启用 Arc 的 Azure AI 视频索引器 是一项已启用 Azure Arc 扩展的服务,可在边缘设备上运行视频和音频分析和 生成 AI 。 该解决方案在 已启用 Azure Arc 的 Kubernetes 上运行,支持许多视频格式,并假定一个视频索引器资源映射到一个扩展。 它用超过 35 种源语言转录口述内容,并将其翻译成英语。 有关支持语言的完整列表,请参阅 每个方案支持的语言

本文将指导你完成在当前基础结构中将视频索引器作为 Arc 扩展启用所需的步骤。

先决条件

重要

若要成功部署 Azure AI 视频索引器扩展, 必须 提前批准 Azure 订阅 ID。 您必须先通过填写 限制访问服务申请表 来注册。

若要使用视频索引器扩展,需要具有面向外部的终结点,该终结点可以是 DNS 名称或 IP 地址。 终结点应设置为安全传输协议(https:\\),并用作扩展 API 终结点。 视频索引器 Web 门户也使用它来与扩展通信。 建议使用入口控件来管理终结点。

注意

如果终结点无法公开访问,则只能从本地网络通过门户网站对扩展执行操作。

本快速入门的最低硬件要求

本快速入门旨在使您能够查看扩展的实际应用。 建议在测试环境中使用较小规格的资源。 对于本快速入门,最低硬件要求如下:

  • CPU:16 个核心
  • 内存:16 GB

节点中的 CPU 应支持 AVX2。 大多数较新的 CPU 都支持该扩展,但在某些较旧的虚拟化环境中可能不受支持。

若要查看 生产 环境中的最低硬件要求,请参阅概述文章中的 最低硬件要求

最低软件要求

组件 最低要求
操作系统 Ubuntu 22.04 LTS 或任何 Linux 兼容 OS
Kubernetes 1.29
Azure 命令行接口 (CLI) 2.64.0

参数定义

下面是用于配置扩展的参数表。

参数  说明
release-namespace 扩展安装到的 Kubernetes 命名空间
集群名称 Kubernetes Azure Arc 实例名称
资源组 Kubernetes Azure Arc 资源组名称
版本 视频索引器扩展版本,为最新保留空
videoIndexer.accountId 视频索引器帐户 ID
videoIndexer.endpointUri 包含要用作扩展外部终结点的 DNS 名称或 IP 地址的 URL
ViAi.gpu.enabled 启用 GPU 进行摘要
ViAi.gpu.tolerations.key 映射使用 GPU 运行摘要的节点。 约定设置为 nvidia.com/gpu
ViAi.gpu.nodeSelector.workload 标识为汇总选择的节点。 设置为 summarization

准备部署

在部署期间,脚本会要求获取特定于环境的值。 准备好这些值,以便在脚本要求它们时复制并粘贴它们。

问题 详细信息
部署期间视频索引器帐户 ID 是什么? GUID 视频索引器帐户标识
部署期间 Azure 订阅 ID 是什么? GUID Azure 订阅 ID
部署期间视频索引器资源组的名称是什么? 字符串 视频索引器帐户的资源组名称
部署期间视频索引器帐户的名称是什么? 字符串 视频索引器帐户名称

使用 Azure 门户进行部署

  1. 在 Azure 门户中,导航到 Azure Arc 连接的群集。
  2. 从菜单中选择“>>Azure AI 视频索引器 Arc 扩展”。
  3. 选择创建。 此时会显示 “创建 AI 视频索引器扩展” 屏幕。
  4. 在实例详细信息配置扩展:
    1. 选择扩展的 订阅资源组
    2. 选择 区域并连接 k8 群集。
    3. 输入扩展的名称
    4. 选择扩展连接到的 Azure AI 视频索引器帐户
    5. 输入 群集终结点(IP 地址或用作 API 终结点的 DNS 名称)。
    6. 提供要用于 Kubernetes 分发支持的扩展的存储类。 例如,如果使用 AKS,则可以使用 azurefile-cli。 有关 AKS 支持的预定义存储类的详细信息,请参阅 AKS 中的存储类。 如果使用的是其他 Kubernetes 发行版,请参阅 Kubernetes 发行版文档,了解支持的预定义存储类或你可以提供自己的存储类的方式。
    7. 选择一个生成式 AI 模型以应用 AI 功能,例如在由 Arc 启用的 VI 上进行文本摘要。有关详细信息,请参阅 Azure AI 视频索引器(VI)的生成式 AI
  5. 选择“查看 + 创建”,然后选择“创建” 。

手动部署

使用示例部署脚本手动部署扩展。 在开始之前,请考虑“存储类型”。

存储类 - 视频索引器扩展要求存储卷必须在 Kubernetes 群集上可用。 存储类需要支持 ReadWriteMany。 请务必注意,索引过程是 IO 密集型的,因此存储卷的 IOPS(每秒输入/输出作数)对进程的持续时间有显著影响。

重要

如果使用语言模型,则必须使用workload:summarization标记节点或节点池。 标签是键值对,键是 workload,值为 summarization。 标有此标签的计算机必须至少有 32 个 CPU(用于生产),我们强烈建议它们是 Intel CPU(而不是 AMD)。

提示

阅读 有关如何将群集连接到 Azure Arc 的文章,了解该过程的完整演练。

可选配置

扩展默认设置设置为处理常见工作负荷,对于特定情况,可以使用以下参数来配置资源分配:

参数 默认 说明
videoIndexer.webapi.resources.requests.cpu 0.5 Web API Pod 的请求核心数
videoIndexer.webapi.resources.requests.mem 4Gi Web API Pod 的请求内存容量
视频索引器.webapi.resources.limits.cpu 1 Web API Pod 的核心数限制
videoIndexer.webapi.resources.limits.mem 6Gi 限制 Web API Pod 的内存容量
storage.storageClass "" 要使用的存储类
存储.使用外部Pvc 确定是否使用外部 PVC。 当为 true 时,VideoIndexer PVC 就不会被安装。
scaling.ai.maxReplicaCount 20 设置 AI 工作负载最大 Pod 规模(不包括汇总)

后续步骤

查看由 Arc 启用的 Azure AI 视频索引器 示例