PyTorchConfiguration 类

表示分布式 PyTorch 作业的配置信息。

此类在类中使用 RunConfiguration

PyTorchConfiguration 构造函数类。

构造函数

PyTorchConfiguration(communication_backend='Nccl', process_count=None, node_count=1)

参数

名称 说明
communication_backend
str

用于 PyTorch 分布式训练的通信后端。 支持的后端为“Nccl”和“Gloo”。 默认值为“Nccl”。

默认值: Nccl
process_count
int

要为作业启动的进程总数。 默认情况下,该值将设置为 node_count.

默认值: None
node_count
int

用于作业的节点数。

默认值: 1