dataset 模块

管理与 Azure 机器学习数据集的交互。

本模块提供用于使用原始数据、管理数据以及对 Azure 机器学习中的数据执行作的功能。 Dataset使用此模块中的类创建数据集以及包中data包含支持类FileDatasetTabularDataset的功能。

若要开始使用数据集,请参阅 “添加和注册数据集”一文。

Dataset

表示用于浏览、转换和管理 Azure 机器学习中的数据的资源。

数据集是对公共 Web URL 中 Datastore 或隐藏的数据的引用。

对于此类中弃用的方法,请检查 AbstractDataset 类中是否有改进的 API。

支持以下数据集类型:

  • TabularDataset 表示通过分析提供的文件或文件列表创建的表格格式的数据。

  • FileDataset 引用数据存储或公共 URL 中的单个或多个文件。

若要开始使用数据集,请参阅 “添加和注册数据集”一文,或查看笔记本 https://aka.ms/tabulardataset-samplenotebookhttps://aka.ms/filedataset-samplenotebook笔记本。

初始化 Dataset 对象。

若要获取已在工作区中注册的数据集,请使用 get 方法。