在 Azure Databricks 用户界面中使用 AutoML

已完成

可以使用 Azure Databricks 门户中的图形用户界面来创建和管理 AutoML 试验。

配置 AutoML 试验

Azure Databricks 中“配置 AutoML 试验”接口的屏幕截图。

若要配置 AutoML 试验,必须针对特定模型训练要求来指定设置,包括:

  • 对其运行试验的群集。
  • 要训练的机器学习模型的类型(聚类分析、回归或预测)。
  • 包含训练数据的表。
  • 模型需要预测的目标标签字段。
  • AutoML 试验的唯一名称(每个训练试验的子运行都会自动进行唯一地命名)。
  • 要用于确定性能最佳的模型的评估指标。
  • 要尝试使用的机器学习训练框架。
  • 试验所需的最长时间。
  • 正标签值(仅适用于二元分类)。
  • 时间列(仅适用于预测模型)。
  • 将经过训练的模型保存在哪里(保存为 MLflow 项目还是保存在 DBFS 存储中)。

查看 AutoML 结果

随着 AutoML 试验的进行,会显示它的子运行,到目前为止产生了最佳性能模型的试验显示在前面。

AutoML 试验界面的屏幕截图,其中包含已完成的运行。

你可以等待试验完成,或者浏览到目前为止生成的模型,如果确信其中一个模型符合你的需求,则停止试验。

可以浏览每个运行,查看已生成的笔记本及其生成的模型的指标。 然后,可以注册模型并进行部署以用于推理。