重要说明
此功能目前为预览版。
面向数据科学和数据工程的 Copilot 是可帮助分析和可视化数据的 AI 助手。 它适用于湖屋表和文件、Power BI 数据集和 Pandas/Spark/Fabric DataFrame,可直接在笔记本中提供答案和代码片段。 与 OneLake 的连接以及默认附加的湖屋使 Copilot 能够提供符合上下文的代码建议以及根据你的数据量身定制的自然语言回复。
Copilot 可以帮助你更好地了解数据,并提供开始笔记本的建议,包括为初始单元格生成代码。 通过 Fabric 对象资源管理器标识和添加数据源后, Copilot Chat 会建议实现模型类型。 可以直接将这些建议复制到笔记本中,以开始开发工作。 如果你不确定接下来该怎么做,可以在单元格内调用 Copilot 来获取关于模型方向的见解。
当你遇到错误时,Copilot 会提供建议的修复方案。 如需进一步的帮助,可以与 Copilot 进行聊天以获取更多选项,避免持续在线搜索。
此外,还可以通过简单的“添加注释”功能从自动文档中受益,该功能汇总代码和数据更改。 这就使你和其他人都能清楚地理解单元格的内容。 在整个工作流中,你可以在特定时间点咨询 Copilot,获得实时支持和指导,以加快开发进程。
注意
在 Microsoft Fabric 中使用 Spark 3.4 及更高版本时,在笔记本中使用 Copilot 无需安装单元格。 不再支持之前需要安装单元格的版本(Spark 3.3 及更早版本)。
注意
- 在开始使用 Copilot 之前,管理员需要启用租户切换。 有关详细信息,请参阅 Copilot 租户设置一文。
- F2 或 P1 容量需要位于 Fabric 区域可用性一文中列出的其中一个区域。
- 如果租户或容量存在于美国或法国以外的区域,那么除非 Fabric 租户管理员在 Fabric 管理门户中启用了Copilot租户设置,否则将默认禁用 。
- 试用版 SKU 不支持 Microsoft Fabric 中的 Copilot。 仅支持付费 SKU(F2 或更高版本或 P1 或更高版本)。
- 请参阅 Fabric 和 Power BI 中的 Copilot 概述一文获取更多信息。
面向 Fabric 数据科学的数据科学与数据工程的 Copilot 简介
借助 Copilot 数据科学和数据工程,可以与 AI 助手聊天来处理数据分析和可视化任务。 可以在笔记本中向 Copilot 询问有关湖屋表、Power BI 数据集或 Pandas/Spark 数据帧的问题。 Copilot 将使用自然语言或代码片段给出答案。 Copilot 还可以根据任务为你生成特定于数据的代码。 例如,面向数据科学与数据工程的 Copilot 可以生成使用适用于以下方面的代码:
- 图表创建
- 数据筛选
- 应用转换
- 机器学习模型
首先在笔记本功能区中选择 Copilot 图标。 此时会打开 Copilot 聊天面板,然后笔记本顶部会显示一个新代码单元。 还可以在你的 Fabric Notebooks 单元格顶部选择 Copilot。
若要最大程度地提高 Copilot有效性,请在笔记本中将表或数据集加载为数据帧。 然后,AI 就可以访问数据并理解其结构和内容。 接下来,开始与 AI 聊天。 在笔记本工具栏中选择聊天图标,并在聊天面板中键入问题或请求。 例如,你可以询问:
- “此数据集中客户的平均年龄是多少?”
- “按区域显示销售条形图。
Copilot 会回复答案或代码,你可以将其复制并粘贴到笔记本中。 面向数据科学与数据工程的 Copilot 是一种便捷的交互式数据浏览和分析方法。
使用Copilot聊天面板与您的数据交互
要与数据聊天并获取见解,请选择笔记本工具栏中的聊天图标,以打开 Copilot 聊天面板。 在聊天面板中输入你的问题或请求。 例如,你可以询问:
- “此数据集中客户的平均年龄是多少?”
- “按区域显示销售条形图。
Copilot 会回复答案或代码,你可以将其复制并粘贴到笔记本中。 此外,Copilot 还可以针对接下来如何处理数据给出建议。 Copilot 会提供建议并生成相关的代码片段,以帮助你继续执行数据分析和可视化任务。
要在 Microsoft Fabric 笔记本中与 Copilot 聊天面板进行交互,请按照以下步骤操作:
Copilot打开聊天面板:在笔记本工具栏中选择聊天图标。
提出问题或发出请求:在聊天面板中输入你的问题或请求。 以下是数据科学和数据工程方面的一些具体示例:
数据研究:
- “这个数据集中‘年龄’列的分布情况是怎样的?”
- “显示‘收入’列的直方图。”
数据清理:
- “我该如何处理这个数据集中的缺失值?”
- “生成从这个数据帧中删除重复项的代码。”
数据转换:
- “如何规范化‘销售额’列?”
- “通过用‘收入’减去‘成本’来创建一个新列‘利润’。”
可视化效果:
- “绘制‘身高’与‘体重’的散点图。”
- “生成‘薪资’列的箱线图。”
机器学习:
- “在这个数据集上训练一个决策树分类器。”
- “生成用于 3 个聚类的 k 均值聚类算法的代码。”
模型评估:
- “我如何评估逻辑回归模型的准确性?
- “为预测结果生成一个混淆矩阵。”
接收回复: 会以自然语言解释或代码片段的形式进行回复。Copilot 可以将代码复制并粘贴到笔记本中执行。
获取建议:如果你不知道接下来该怎么做,可以向 咨询建议:Copilot
- “对于这个数据集,我接下来该做什么?”
- “对于这些数据,有哪些推荐的特征工程技术?”
- 使用生成的代码:从聊天面板中复制生成的代码片段,并将其粘贴到笔记本单元格中运行。
通过这些步骤和提供的示例,你可以有效地与 Copilot 聊天面板进行交互,从而在 Microsoft Fabric 笔记本中增强数据科学和数据工程工作流。
使用 Copilot 单元格内面板和快速操作
可以在笔记本单元格内直接与 Copilot 进行交互,以生成代码并对代码单元格执行快速操作。 下面介绍了如何使用 Copilot 单元格内面板:
- 生成代码:要为特定任务生成代码,可以使用 单元格内面板。Copilot 例如,可以在代码单元格上方的文本面板中输入请求:
Can you generate code for a logistic regression that fits this data?
Copilot 会直接在下方的单元格中提供必要的代码片段。
修复代码:可以让 修复代码中的错误。Copilot 在代码单元格上方的文本面板中输入请求,Copilot 会给出修正建议。
添加注释:要自动为代码添加文档说明,请使用“添加注释”功能。 Copilot 生成汇总代码和数据更改的注释,使笔记本更易于阅读。
优化代码:为了提高性能,可以让 优化代码。Copilot Copilot 会提供提高代码效率的建议。
说明代码:如果需要弄清楚某段代码,可以让 进行说明。Copilot Copilot 会详细说明该代码的功能。
使用快速操作的步骤
在单元格内调用 Copilot:选择笔记本工具栏中的 图标,开始与 Copilot 进行交互。Copilot
键入请求:在代码单元格上方的文本面板中输入请求或问题。 例如:
Explain the following code snippet.
接收建议: 会回复相关的代码、修复程序、注释、优化建议或解释。Copilot
应用建议:从 复制生成的代码或建议,并粘贴到笔记本单元格中执行。Copilot
借助 Copilot 单元格内面板,你可以在 Microsoft Fabric 笔记本中生成代码、修复错误、添加注释、优化性能并更好地理解代码。
面向数据科学与数据工程的 Copilot 还可以感知湖屋表的架构和元数据。 Copilot 可以根据附加湖屋中托管的数据提供相关信息。 例如,你可以询问:
- “湖屋里有多少个表?”
- “Customers 表有哪些列?”
如果将湖屋添加到笔记本,Copilot 会回复相关信息。 Copilot 还可以感知添加到附加于笔记本的任何湖屋的文件名称。 可以在聊天中按名称引用这些文件。 例如,如果湖屋中存在名为 sales.csv 的文件,则可以让 “根据 sales.csv 创建数据帧”。Copilot Copilot 会生成代码并在聊天面板中显示它。 借助适用于笔记本的 Copilot,可以轻松访问和查询来自不同源的数据。 不需要使用确切的命令语法即可执行此操作。
Copilot 内联代码补全(预览版)
Copilot 内联代码完成是一项由 AI 提供支持的功能,可帮助你在 Fabric Notebooks 中更快、更高效地编写代码。 键入代码时,此功能提供智能上下文感知代码建议。 若要了解详细信息, Copilot 请参阅内联代码完成
提示
- 在 Copilot 聊天面板中,可以使用位于聊天面板顶部的扫把“清除”对话。 Copilot 在会话期间会保留任何输入或输出的知识,但如果发现当前内容分散注意力,这会非常有用。
- 使用聊天魔法库配置有关 Copilot 的设置,包括隐私设置。 默认的共享模式可最大限度地提高 Copilot 能够访问的上下文共享。 因此,将提供的信息限制在Copilot之内,可以直接并且显著地影响其响应的相关性。
- 当 Copilot 首次启动时,它会提供一组可以帮助你开始使用的有用提示。 它们可以帮助启动你与 Copilot 的对话。 要在以后参考提示,可以使用聊天面板底部的闪烁按钮。
- 可以“拖动”聊天边 Copilot 栏以展开聊天面板,以便更清楚地查看代码或提高屏幕上输出的可读性。
限制
数据科学体验中的 Copilot 功能目前仅限于笔记本。 这些功能包括 Copilot 聊天窗格、可在代码单元中使用的 IPython magic 命令,以及在代码单元中键入时显示的自动代码建议。 Copilot 还可以使用语义链接集成来读取 Power BI 语义模型。
Copilot 有两个关键预期用途:
- 可以要求 Copilot 检查和分析笔记本中的数据(例如,首先加载数据帧,然后向 Copilot 询问数据帧内的数据)。
- 可以要求 Copilot 生成一系列有关数据分析过程的建议,例如可能相关的预测模型、执行不同类型数据分析的代码以及已完成笔记本的文档。
使用快速移动或最近发布的库生成的代码可能包含不准确或捏造的内容。
删除和导出数据
笔记本中的 Copilot 为用户提供了两个用于管理笔记本单元格内聊天历史记录的重要命令:show_chat_history 和 clear_chat_history。 show_chat_history 命令用于出于合规目的导出完整的聊天历史记录,以确保所有必要的交互都有记录且可供查阅。 例如,执行 show_chat_history 会生成一份全面的聊天历史记录日志,之后可以对其进行查阅或存档以实现合规性。
clear_chat_history 命令会从笔记本中删除所有之前的对话,以便用户可以重新开始。 此命令会清除旧的交互记录,以开启新的对话线程。 例如,执行 clear_chat_history 会删除所有之前的聊天历史记录,使笔记本中不再包含任何过往对话。 这些功能增强了笔记本中 Copilot 的整体功能和用户体验。