在 Azure Databricks 用户界面中使用 AutoML
可以使用 Azure Databricks 门户中的图形用户界面来创建和管理 AutoML 试验。
配置 AutoML 试验
若要配置 AutoML 试验,必须针对特定模型训练要求来指定设置,包括:
- 对其运行试验的群集。
- 要训练的机器学习模型的类型(聚类分析、回归或预测)。
- 包含训练数据的表。
- 模型需要预测的目标标签字段。
- AutoML 试验的唯一名称(每个训练试验的子运行都会自动进行唯一地命名)。
- 要用于确定性能最佳的模型的评估指标。
- 要尝试使用的机器学习训练框架。
- 试验所需的最长时间。
- 正标签值(仅适用于二元分类)。
- 时间列(仅适用于预测模型)。
- 将经过训练的模型保存在哪里(保存为 MLflow 项目还是保存在 DBFS 存储中)。
查看 AutoML 结果
随着 AutoML 试验的进行,会显示它的子运行,到目前为止产生了最佳性能模型的试验显示在前面。
你可以等待试验完成,或者浏览到目前为止生成的模型,如果确信其中一个模型符合你的需求,则停止试验。
可以浏览每个运行,查看已生成的笔记本及其生成的模型的指标。 然后,可以注册模型并进行部署以用于推理。