你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure AI Foundry 模型的模型弃用和停用

模型目录中的 Azure AI Foundry 模型通过更新且功能更强的模型不断刷新。 在此过程中,模型提供商可能会弃用和停用其较旧的模型,你可能需要更新应用程序以使用较新的模型。 本文档阐述了模型生命周期和弃用时间线,并说明了如何了解模型生命周期阶段。

模型生命周期阶段

模型目录中的模型属于以下阶段之一:

  • 预览
  • 普遍可用
  • 遗产
  • 已弃用
  • 已停用

预览

标记为“预览版”的模型本质上是试验性的。 当模型为预览版时,模型的权重、运行时和 API 架构可能会发生变化。 预览版模型并不保证能够正式发布。 在模型目录中,预览版模型在其名称旁边有一个“预览版”标签。

普遍可用

此阶段是默认模型阶段。 名称旁边不包含生命周期标签的模型是正式发布的模型,适合在生产环境中使用。 在此阶段,模型权重和 API 是固定的。 但是,具有漏洞的模型容器或运行时可能会得到修补,但修补程序不会影响模型输出。

遗产

标记为“旧版”的模型是要弃用的。 你应该计划转向其他模型,例如可能会在同一模型系列中提供的新型改进模型。 当模型处于旧版阶段时,模型的现有部署仍可继续使用,你可以在弃用日期之前创建模型的新部署。

已弃用

标记为“已弃用”的模型不再适用于新部署。 无法为该模型创建任何新部署;不过,现有部署可继续使用到停用日期为止。

已停用

标记为“已停用”的模型不再可供使用。 无法创建新部署,尝试使用现有部署会返回 <return code> 错误。

通知

  • 模型会被标记为“旧版”,并且会保留在旧版状态至少 30 天,之后才会转为已弃用状态。 在此通知期间,你可以在为弃用和停用做准备时创建新部署。

  • 模型会被标记为“已弃用”,并且会保留在已弃用状态至少 90 天,之后才会转为已停用状态。 此通知期间,你可以将任何现有部署迁移到较新的模型或替换模型。

  • 对于有模型部署为标准部署或部署到 Foundry 模型的每个订阅,当宣布模型弃用时,所有者、参与者、读取者、监视参与者和监视读取者角色的成员将收到通知。 通知包含模型进入旧版状态、已弃用状态和已停用状态的日期。 在适用的情况下,通知可能会提供有关可能的替换模型选项的信息。

关于 Foundry 中的 Azure OpenAI 模型的更多通知详细信息

此外,对于 Azure OpenAI 模型,具有有效 Azure OpenAI 部署的客户会收到即将停用的模型的相关通知,如下所示:

  • 在模型启动时,我们以编程方式指定“不早于”停用日期(通常为一年)。
  • 在正式版 (GA) 模型停用前至少 60 天通知。
  • 预览模型版本升级前提前至少 30 天发出通知。

退休会按地区逐步进行。 通知是从无人监管的邮箱 azure-noreply@microsoft.com 发送的。

Azure OpenAI 模型的模型可用性

  • 在全球至少一个区域的模型发布日期之后,GA 模型至少有一年的模型可用性。
  • 对于全局部署,所有从gpt-4ogpt-4 0409开始的未来模型版本都将与其(N)随后推出的模型(N+1)一起进行比较。
  • 在对较新的 GA 模型进行任何升级之前,客户在至少一个全局或标准区域中试用新的 GA 模型 60 天。

Azure 公有云的注意事项

请注意 Azure 公有云的以下详细信息:

  • 并非所有地区都提供所有模型版本组合。
  • 模型版本NN+1可能并不总是在同一区域中可用。
  • GA 模型版本N可能会根据容量限制在一些区域中升级到未来的模型版本N+X,并且没有新的模型版本N+X可单独用于在同一区域中进行测试。 在计划任何升级之前,新模型版本将可用于在其他区域中进行测试。
  • 同一模型的预览模型版本和 GA 版本并不总是可用于在同一区域中一起测试。 将有预览版本和 GA 版本可供在不同区域中进行测试。
  • 为了平衡现有客户的服务质量,我们保留限制未来客户使用特定区域的权利。
  • 在 Microsoft,安全始终是最重要的。 如果发现模型或模型版本存在合规性或安全问题,我们保留要求紧急停用的权利。 有关详细信息,请参阅服务条款。

Azure 政府云的特殊注意事项

  • 全局标准部署在政府云中不可用。
  • 并非所有商业/公有云中可用的模型或模型版本都将在政府云中提供。
  • 在 Azure 政府云中,我们计划一次只支持一个给定模型的一个版本。
    • 例如,gpt-35-turbo 0125gpt-4o (2024-05-13) 只有一个版本。
  • 但是,新的模型版本之间会有 30 天的重叠期,其间将有多个版本可用。
    • 例如,如果gpt-35-turbo 0125gpt-4o (2024-05-13)已更新到将来的版本,或者
    • 对于版本更新之外的模型系列更改,例如从 gpt-4 1106-preview 移动到 gpt-4o (2024-05-13) 时。

如何为模型停用和版本升级做好准备

为了准备模型停用和版本升级,建议客户使用新模型和版本测试应用程序,并评估其行为。 还建议客户在停用日期之前更新应用程序以使用新模型和版本。

有关模型评估过程的详细信息,请参阅模型评估入门指南

有关模型升级过程的信息,请参阅 Azure AI Foundry 模型中的模型版本 以及如何 升级到新的模型或版本

有关如何管理预配部署的模型升级和迁移的详细信息,请参阅管理预配部署类型的模型

Azure OpenAI 模型的时间线

以下部分列出了当前、默认和已弃用的 Azure OpenAI 模型。

当前 Azure OpenAI 模型

注释

并非所有模型在退役前都经历贬值期。 某些模型/版本只有停用日期。

微调的模型遵循与其同等基础模型相同的弃用和停用计划。

指定的日期采用 UTC 时间。

这些模型目前可用于 Azure OpenAI。

型号 版本 停用日期 替换模型
computer-use-preview 2025年3月11日 不早于 2025 年 6 月 11 日
dall-e-3 3 不早于 2025 年 6 月 30 日
gpt-35-turbo-16k 0613 2025 年 4 月 30 日 gpt-4.1-mini 版本:2025-04-14
gpt-35-turbo 1106 不早于 2025 年 7 月 16 日 gpt-4.1-mini 版本:2025-04-14
gpt-35-turbo 0125 不早于 2025 年 7 月 16 日 gpt-4.1-mini 版本:2025-04-14
gpt-4
gpt-4-32k
0314 2025 年 6 月 6 日 gpt-4o 版本:2024-11-20
gpt-4
gpt-4-32k
0613 2025 年 6 月 6 日 gpt-4o 版本:2024-11-20
gpt-4 turbo-2024-04-09 不早于 2025 年 6 月 6 日 gpt-4o 版本:2024-11-20
gpt-4 1106-preview 2025 年 5 月 1 日 gpt-4o 版本:2024-11-20
gpt-4 0125-preview 2025 年 5 月 1 日 gpt-4o 版本:2024-11-20
gpt-4 vision-preview 2025 年 5 月 15 日 gpt-4o 版本:2024-11-20
gpt-4.5-preview 2025-02-27 无自动升级
2025 年 7 月 14 日
gpt-4.1 版本:2025-04-14
gpt-4.1 2025-04-14 不早于 2026 年 4 月 11 日
gpt-4.1-mini 2025-04-14 不早于 2026 年 4 月 11 日
gpt-4.1-nano 2025-04-14 不早于 2026 年 4 月 11 日
gpt-4o 2024年5月13日 不早于 2025 年 6 月 30 日 gpt-4.1 版本:2025-04-14
gpt-4o 2024-08-06 不早于 2025 年 8 月 6 日 gpt-4.1 版本:2025-04-14
gpt-4o 2024年11月20日 不早于 2026 年 3 月 1 日 gpt-4.1 版本:2025-04-14
gpt-4o-mini 2024年07月18日 不早于 2025 年 8 月 16 日 gpt-4.1-mini 版本:2025-04-14
gpt-3.5-turbo-instruct 0914 不早于 2025 年 5 月 31 日
gpt-image-1 2025-04-15 不早于 2025 年 8 月 1 日
o1-preview 2024-09-12 2025 年 5 月 29 日 o1
o1 2024年12月17日 不早于 2025 年 12 月 17 日
o4-mini 2025-04-16 不早于 2026 年 4 月 11 日
o3 2025-04-16 不早于 2026 年 4 月 11 日
o3-mini 2025年1月31日 不早于 2026 年 2 月 1 日
text-embedding-ada-002 2 不早于 2026 年 4 月 30 日 text-embedding-3-smalltext-embedding-3-large
text-embedding-ada-002 1 不早于 2026 年 4 月 30 日 text-embedding-3-smalltext-embedding-3-large
text-embedding-3-small 不早于 2026 年 4 月 30 日
text-embedding-3-large 不早于 2026 年 4 月 30 日

我们将在升级开始前至少 30 天通知所有客户这些预览部署。 我们将发布一个升级日程安排,详细说明升级期间区域和模型版本的升级顺序,并会在此处给出该计划的链接。

小窍门

如果新模型版本在该区域中尚不可用,模型升级是否会发生?

是的,即使区域中尚未提供最新的模型版本,我们也会在计划的升级时段内自动升级部署。 有关详细信息,请参阅 Azure OpenAI 模型版本

重要

gpt-4 版本 vision-preview 升级到 turbo-2024-04-09 后,视觉增强预览版功能(包括光学字符识别 (OCR)、对象上下文关联、视频提示)将会停用且不再可供使用。 如果你当前依赖上述任何预览功能,那么这种自动模型升级将导致重大变更。

默认 Azure OpenAI 模型版本

型号 当前默认版本 新默认版本 默认升级日期
gpt-35-turbo 0301 0125 从 2025 年 1 月 21 日开始,设置为“0301”的 06131106 版本的部署将自动升级到版本
gpt-4o 2024-08-06 - -

弃用的 Azure OpenAI 模型

这些模型不再用于新部署。

如果你是现有客户,想要了解这些模型的信息,请参阅旧模型

型号 弃用日期 停用日期 建议的替换
gpt-4o-realtime-preview - 2024年10月01日 2025 年 2 月 25 日 2025 年 3 月 26 日 gpt-4o-realtime-preview(版本 2024-12-17)或 gpt-4o-mini-realtime-preview(版本 2024-12-17)
gpt-35-turbo - 0301 2025 年 2 月 13 日 gpt-35-turbo (0125)

gpt-4o-mini
gpt-35-turbo - 0613 2025 年 2 月 13 日 gpt-35-turbo (0125)

gpt-4o-mini
babbage-002 2025 年 1 月 27 日
davinci-002 2025 年 1 月 27 日
dall-e-2 2025 年 1 月 27 日 dalle-3
ada 2023 年 7 月 6 日 2024 年 6 月 14 日
babbage 2023 年 7 月 6 日 2024 年 6 月 14 日
curie 2023 年 7 月 6 日 2024 年 6 月 14 日
davinci 2023 年 7 月 6 日 2024 年 6 月 14 日
text-ada-001 2023 年 7 月 6 日 2024 年 6 月 14 日 gpt-35-turbo-instruct
text-babbage-001 2023 年 7 月 6 日 2024 年 6 月 14 日 gpt-35-turbo-instruct
text-curie-001 2023 年 7 月 6 日 2024 年 6 月 14 日 gpt-35-turbo-instruct
text-davinci-002 2023 年 7 月 6 日 2024 年 6 月 14 日 gpt-35-turbo-instruct
text-davinci-003 2023 年 7 月 6 日 2024 年 6 月 14 日 gpt-35-turbo-instruct
code-cushman-001 2023 年 7 月 6 日 2024 年 6 月 14 日 gpt-35-turbo-instruct
code-davinci-002 2023 年 7 月 6 日 2024 年 6 月 14 日 gpt-35-turbo-instruct
text-similarity-ada-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-similarity-babbage-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-similarity-curie-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-similarity-davinci-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-search-ada-doc-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-search-ada-query-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-search-babbage-doc-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-search-babbage-query-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-search-curie-doc-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-search-curie-query-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-search-davinci-doc-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
text-search-davinci-query-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
code-search-ada-code-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
code-search-ada-text-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
code-search-babbage-code-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small
code-search-babbage-text-001 2023 年 7 月 6 日 2024 年 6 月 14 日 text-embedding-3-small

若要跟踪有关 Azure OpenAI 模型退役的各项更新,请参见 Git History

其他 Foundry 模型的日程表

下表列出了即将停用的模型的时间线。 指定的日期采用 UTC 时间。

AI21 实验室

型号 遗留日期 (UTC) 弃用日期 (UTC) 停用日期 (UTC) 建议的替换模型
Jamba Instruct 2025 年 2 月 1 日 2025 年 2 月 1 日 2025 年 3 月 1 日
AI21-Jamba-1.5-Large 2025 年 5 月 1 日 2025 年 7 月 1 日 2025 年 8 月 1 日
AI21-Jamba-1.5-Mini 2025 年 5 月 1 日 2025 年 7 月 1 日 2025 年 8 月 1 日

Cohere

型号 遗留日期 (UTC) 弃用日期 (UTC) 停用日期 (UTC) 建议的替换模型
命令 R 2025 年 2 月 24 日 2025 年 3 月 25 日 2025 年 6 月 30 日 Cohere Command R 08-2024
命令 R+ 2025 年 2 月 24 日 2025 年 3 月 25 日 2025 年 6 月 30 日 Cohere Command R+ 08-2024
Cohere-rerank-v3-english 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Cohere-rerank-v3.5-english
Cohere-rerank-v3-多语言支持 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Cohere-rerank-v3.5-multilingual

DeepSeek

型号 遗留日期 (UTC) 弃用日期 (UTC) 停用日期 (UTC) 建议的替换模型
DeepSeek-V3 2025 年 4 月 10 日 2025 年 5 月 31 日 2025 年 8 月 31 日 DeepSeek-V3-0324

Meta

型号 遗留日期 (UTC) 弃用日期 (UTC) 停用日期 (UTC) 建议的替换模型
Llama-2-13b 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Meta-Llama-3.1-8B-Instruct
Llama-2-13b-chat 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Meta-Llama-3.1-8B-Instruct
Llama-2-70b 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Llama-3.3-70B-Instruct
Llama-2-70b-chat 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Llama-3.3-70B-Instruct
Llama-2-7b 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Meta-Llama-3.1-8B-Instruct
Llama-2-7b-chat 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Meta-Llama-3.1-8B-Instruct
Meta-Llama-3-70B-Instruct 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Llama-3.3-70B-Instruct
Meta-Llama-3-8B-Instruct 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Meta-Llama-3.1-8B-Instruct
Meta-Llama-3.1-70B-Instruct 2025 年 2 月 28 日 2025 年 3 月 31 日 2025 年 6 月 30 日 Llama-3.3-70B-Instruct

Mistral人工智能

型号 遗留日期 (UTC) 弃用日期 (UTC) 停用日期 (UTC) 建议的替换模型
Mistral-small 2025 年 3 月 31 日 2025 年 4 月 30 日 2025 年 7 月 31 日 Mistral-small-2503
Mistral-large-2407 2025 年 1 月 13 日 2025 年 2 月 13 日 2025 年 5 月 13 日 Mistral-large-2411
Mistral-large 2024 年 12 月 15 日 2025 年 1 月 15 日 2025 年 4 月 15 日 Mistral-large-2411