了解如何使用顶点执行视图来测试 Data Lake Analytics 作业。
重要
Azure Data Lake Analytics 于 2024 年 2 月 29 日停用。 通过此公告了解详细信息。
对于数据分析,组织可以使用 Azure Synapse Analytics 或 Microsoft Fabric。
打开顶点执行视图
在用于 Visual Studio 的 Data Lake 工具中打开 U-SQL 作业。 选择左下角的 顶点执行视图 。 系统可能会提示先加载配置文件,可能需要一些时间,具体取决于网络连接。
了解顶点执行视图
顶点执行视图有三个部分:
通过左侧的 顶点选择器 ,可以按特征(如读取前 10 个数据或按阶段选择)选择顶点。 最常用的过滤器之一是查看 关键路径上的顶点。 关键路径是 U-SQL 作业的最长顶点链。 通过检查哪个顶点花费的时间最长,了解关键路径对于优化作业非常有用。
顶部中心窗格显示 所有顶点的运行状态。
底部中心窗格显示每个顶点的相关信息:
- 进程名称:顶点实例的名称。 它由 StageName、VertexName 和 VertexRunInstance 中的不同部分组成。 例如,SV7_Split[62].v1 顶点表示阶段SV7_Split中第二个正在运行的实例(.v1,从 0 开始)的索引。
- 读取/写入数据总量:该数据由此顶点读取/写入。
- 状态/退出状态:顶点结束时的最终状态。
- 退出代码/失败类型:顶点发生故障时的错误。
- 创建原因:创建顶点的原因。
- 资源延迟/进程延迟/PN 队列延迟:顶点等待资源、处理数据以及保留在队列中所需的时间。
- 进程/创建者 GUID:当前正在运行的顶点或其创建者的 GUID。
- 版本:正在运行的顶点的第 N 个实例(系统可能出于多种原因计划顶点的新实例,例如故障转移、计算冗余等)
- 版本创建时间。
- 进程创建开始时间/进程排队时间/进程开始时间/进程完成时间:当顶点进程开始创建时;当顶点进程开始排队时;当某些顶点进程启动时;完成特定顶点时。
后续步骤
- 若要记录诊断信息,请参阅 访问 Azure Data Lake Analytics 的诊断日志
- 若要查看更复杂的查询,请参阅 使用 Azure Data Lake Analytics 分析网站日志。
- 若要查看作业详细信息,请参阅 在 Azure Data Lake Analytics 中使用作业浏览器和作业视图