你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
有据性检测功能检测大型语言模型 (LLM) 的文本响应是否以用户提供的源材料为依据。 无据性是指 LLM 生成的信息与源材料中的信息不符或不准确。
关键术语
- 检索增强生成 (RAG):RAG 是一种利用其他数据增强 LLM 知识的技术。 LLM 可以推理广泛的主题,但其知识仅限于在训练时可用的公共数据。 如果想要构建能够推理专用数据或模型截止日期后引入的数据的 AI 应用程序,需要向模型提供该特定信息。 引入相应的信息并将其插入模型提示的过程称为“检索增强生成 (RAG)”。 有关详细信息,请参阅检索增强生成 (RAG)。
- LLM 中的有据性和无据性:是指模型的输出基于所提供的信息或准确反映可靠来源的程度。 有据响应与给定的信息密切相关,避免猜测或捏造。 在有据性度量中,源信息至关重要,并充当有据源。
用户方案
有据性检测支持基于文本的摘要和 QnA 任务,以确保生成的摘要或答案准确可靠。
摘要任务:
- 医疗摘要:在医疗新闻文章中,可以使用有据性检测来确保摘要中不包含捏造或误导性信息,保证读者获得准确可靠的医疗信息。
- 学术论文摘要:当模型生成学术论文或研究文章的摘要时,此功能可以帮助确保摘要内容准确地代表重要发现和贡献,而不会引入虚假声明。
QnA 任务:
- 客户支持聊天机器人:在客户支持中,此功能可用于验证 AI 聊天机器人提供的答案,确保客户在询问有关产品或服务的问题时获得准确且可信的信息。
- 医疗 QnA:对于医疗 QnA,此功能有助于验证 AI 系统向医护人员和患者提供的医疗答案和建议的准确性,从而降低医疗错误的风险。
- 教育 QnA:在教育环境中,此功能可以应用于 QnA 任务,以确认学术问题或备考查询的答案准确,在学习过程中提供支持。
下面,请查看几个常见场景,它们描述了如何以及何时应用这些功能来实现最佳结果。
医学语境中的汇总
你正在汇总医学文档,摘要中患者姓名准确且与提供的基础源一致至关重要。
示例 API 请求:
{
"___domain": "Medical",
"task": "Summarization",
"text": "The patient name is Kevin.",
"groundingSources": [
"The patient name is Jane."
],
}
预期结果:
纠正功能检测到 Kevin
上下文不关联,因为它与基础源 Jane
冲突。 API 返回纠正的文本:"The patient name is Jane."
使用客户支持数据的问答 (QnA) 任务
你正在为客户支持聊天机器人实现 QnA 系统。 AI 提供的答案与最新、准确的可用信息保持一致,这一点至关重要。
示例 API 请求:
{
"___domain": "Generic",
"task": "QnA",
"qna": {
"query": "What is the current interest rate?"
},
"text": "The interest rate is 5%.",
"groundingSources": [
"As of July 2024, the interest rate is 4.5%."
],
}
预期结果:
该 API 检测到 5%
未接地,因为它与所提供的接地源 4.5%
不匹配。 答复包含纠正文本:"The interest rate is 4.5%."
使用历史数据创建内容
你正在创建涉及历史数据或事件的内容,为了保持可信度和避免信息错误,准确性至关重要。
示例 API 请求:
{
"___domain": "Generic",
"task": "Summarization",
"text": "The Battle of Hastings occurred in 1065.",
"groundingSources": [
"The Battle of Hastings occurred in 1066."
],
}
预期结果:
API 会检测无依据日期 1065
,并根据依据源将其更正为 1066
。 答复包含纠正后的文本:"The Battle of Hastings occurred in 1066."
内部文档汇总
你正在汇总内部文档,其中产品名称、版本号或其他特定数据点必须保持一致。
示例 API 请求:
{
"___domain": "Generic",
"task": "Summarization",
"text": "Our latest product is SuperWidget v2.1.",
"groundingSources": [
"Our latest product is SuperWidget v2.2."
],
}
预期结果:
更正功能将 SuperWidget v2.1
标识为“无依据”,并在响应中将其更新为 SuperWidget v2.2
。 答复返回纠正后的文本:"Our latest product is SuperWidget v2.2."