你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
使用本文大致了解从 2024-11-01
版本开始的新 API 更改。 此 API 更改主要引入了两个新概念 (entity types
和entity tags
) 替换当前正式版 API 中的category
和subcategory
字段。 每个 API 参数及其对应的受支持 API 版本的详细概述可以在[技能参数][../how-to/skill-parameters.md]页上找到。
由于像“西雅图”这样的实体可以被归类为城市、GPE(地理政治实体)和位置,因此 type
属性用于定义最精细的分类,在本例中为城市。 服务输出中的 tags
属性是一个列表,列出了所有可能的分类(城市、GPE 和位置)及其各自的置信度分数。 下面提供了每种类型的可能标记的完整映射。 服务输出中的 metadata
属性包含有关实体的其他信息,例如与实体关联的整数值。
实体类型
实体类型表示检测到实体的最低 (或最佳) 粒度,可被视为已检测到的基类。
实体标记
实体标记用于进一步标识检测到的实体按实体类型标记的实体,以及用于区分已标识实体的其他标记。 可以将实体标记列表视为包含类别、子类别、子子类别等。
从版本 2022-05-01
和 2023-04-01
更改为版本 2024-11-01
API
这些更改为命名实体识别服务带来了更好的灵活性,包括:
对输入格式结构的更新:• InclusionList • ExclusionList • Overlap 策略
对输出格式处理方式的更新:
- 通过引入标记列表实现更精细的实体识别输出,其中一个实体可由多个实体标记进行标记。
- 重叠实体,其中实体可以识别为多个实体类型,如果是,则此实体将返回两次。 如果某个实体被识别为属于同一实体类型下的两个实体标记,则会在标记列表中返回这两个实体标记。
- 使用实体标签筛选实体,你可以通过导航至此文了解更多信息。
- 包含有关实体的其他信息的元数据对象,但当前仅充当现有实体解析功能的包装器。 可在此处了解有关此新功能的详细信息。
版本 2022-05-01
和 2023-04-01
到当前版本 API 实体映射
可以在支持的命名实体识别 (NER) 实体类别和实体类型一文中查看实体类别/类型结构之间的比较。 下表描述了预期从版本 2022-05-01
和 2023-04-01
和当前版本 API 中看到的结果之间的映射。
类型 | 标记 |
---|---|
日期 | 临时、日期 |
DateRange | 临时、DateRange |
DateTime | 临时、DateTime |
DateTimeRange | 临时、DateTimeRange |
持续时间 | 临时,持续时间 |
SetTemporal | 临时,SetTemporal |
时间 | 临时,时间 |
时间范围 | 临时,TimeRange |
城市 | GPE、位置、城市 |
状态 | GPE、位置、状态 |
CountryRegion | GPE、位置、CountryRegion |
大陆 | GPE、位置、所在洲 |
GPE | 位置、GPE |
位置 | 位置 |
飞机场 | 结构、位置 |
Structural | 位置、结构 |
地质 | 位置、地质 |
年龄 | 数值、年龄 |
货币 | 数值、货币 |
编号 | 数值、数字 |
电话号码 | 电话号码 |
NumberRange | 数值、NumberRange |
百分比 | 数值、百分比 |
Ordinal | 数值、序号 |
温度 | 数值、维度、温度 |
速度 | 数值、维度、速度 |
重量 | 数值、维度、重量 |
高度 | 数值、维度、高度 |
长度 | 数值、维度、长度 |
数据量(Volume) | 数值、维度、体积 |
区域 | 数值、维度、面积 |
信息 | 数值、维度、信息 |
地址 | 地址 |
人员 | 人员 |
人员类型 | 人员类型 |
组织 | 组织 |
产品 | 产品 |
ComputingProduct | Product, ComputingProduct |
知识产权 | 知识产权 |
电子邮件 | 电子邮件 |
网址 | 网址 |
技能 | 技能 |
事件 | 事件 |
CulturalEvent | 事件、CulturalEvent |
体育赛事 | 事件、SportsEvent |
NaturalEvent | 事件、NaturalEvent |