你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

实体类型和标记

使用本文大致了解从 2024-11-01 版本开始的新 API 更改。 此 API 更改主要引入了两个新概念 (entity typesentity tags) 替换当前正式版 API 中的categorysubcategory字段。 每个 API 参数及其对应的受支持 API 版本的详细概述可以在[技能参数][../how-to/skill-parameters.md]页上找到。

由于像“西雅图”这样的实体可以被归类为城市、GPE(地理政治实体)和位置,因此 type 属性用于定义最精细的分类,在本例中为城市。 服务输出中的 tags 属性是一个列表,列出了所有可能的分类(城市、GPE 和位置)及其各自的置信度分数。 下面提供了每种类型的可能标记的完整映射。 服务输出中的 metadata 属性包含有关实体的其他信息,例如与实体关联的整数值。

实体类型

实体类型表示检测到实体的最低 (或最佳) 粒度,可被视为已检测到的基类。

实体标记

实体标记用于进一步标识检测到的实体按实体类型标记的实体,以及用于区分已标识实体的其他标记。 可以将实体标记列表视为包含类别、子类别、子子类别等。

从版本 2022-05-012023-04-01 更改为版本 2024-11-01 API

这些更改为命名实体识别服务带来了更好的灵活性,包括:

对输入格式结构的更新:• InclusionList • ExclusionList • Overlap 策略

对输出格式处理方式的更新:

  • 通过引入标记列表实现更精细的实体识别输出,其中一个实体可由多个实体标记进行标记。
  • 重叠实体,其中实体可以识别为多个实体类型,如果是,则此实体将返回两次。 如果某个实体被识别为属于同一实体类型下的两个实体标记,则会在标记列表中返回这两个实体标记。
  • 使用实体标签筛选实体,你可以通过导航至此文了解更多信息。
  • 包含有关实体的其他信息的元数据对象,但当前仅充当现有实体解析功能的包装器。 可在此处了解有关此新功能的详细信息。

版本 2022-05-012023-04-01 到当前版本 API 实体映射

可以在支持的命名实体识别 (NER) 实体类别和实体类型一文中查看实体类别/类型结构之间的比较。 下表描述了预期从版本 2022-05-012023-04-01 和当前版本 API 中看到的结果之间的映射。

类型 标记
日期 临时、日期
DateRange 临时、DateRange
DateTime 临时、DateTime
DateTimeRange 临时、DateTimeRange
持续时间 临时,持续时间
SetTemporal 临时,SetTemporal
时间 临时,时间
时间范围 临时,TimeRange
城市 GPE、位置、城市
状态 GPE、位置、状态
CountryRegion GPE、位置、CountryRegion
大陆 GPE、位置、所在洲
GPE 位置、GPE
位置 位置
飞机场 结构、位置
Structural 位置、结构
地质 位置、地质
年龄 数值、年龄
货币 数值、货币
编号 数值、数字
电话号码 电话号码
NumberRange 数值、NumberRange
百分比 数值、百分比
Ordinal 数值、序号
温度 数值、维度、温度
速度 数值、维度、速度
重量 数值、维度、重量
高度 数值、维度、高度
长度 数值、维度、长度
数据量(Volume) 数值、维度、体积
区域 数值、维度、面积
信息 数值、维度、信息
地址 地址
人员 人员
人员类型 人员类型
组织 组织
产品 产品
ComputingProduct Product, ComputingProduct
知识产权 知识产权
电子邮件 电子邮件
网址 网址
技能 技能
事件 事件
CulturalEvent 事件、CulturalEvent
体育赛事 事件、SportsEvent
NaturalEvent 事件、NaturalEvent