DataType 类

帮助程序类,用于处理支持的列类型(int、bool、string 等)的正确作。 当前与 MLTable.convert_column_types(...)from_delimited_files(...) 一起使用,用于指定要将列转换为的类型。 选择不同类型的 DataType.from_(...)*方法。

构造函数

DataType()

方法

to_bool

配置到布尔的转换。 true_valuesfalse_values 必须是 None 或非空列表,否则将引发错误。

to_datetime

配置到 datetime 的转换。

to_float

配置到 64 位浮点数的转换。

to_int

配置到 64 位整数的转换。

to_stream

配置到流的转换。

to_string

配置到字符串的转换。

to_bool

配置到布尔的转换。 true_valuesfalse_values 必须是 None 或非空列表,否则将引发错误。

static to_bool(true_values: List[str] | None = None, false_values: List[str] | None = None, mismatch_as: str | None = None)

参数

名称 说明
true_values

数据集中要指定为 True 的值的列表。 例如,['1', 'yes'] 将被替换为 [True, True]。 true_values需要存在于数据集中,否则不会为不存在的值返回 None。

默认值: None
false_values

数据集中要指定为 False 的值的列表。 例如,['0', 'no'] 将被替换为 [False, False]。 数据集中需要存在false_values;否则,对于不存在的值,将返回 None。

默认值: None
mismatch_as

如何在 true_valuesfalse_values中转换字符串;“true”将所有转换为 True,“false”为 False,“error”将错误而不是强制转换。 默认值为“none”,等于“error”。

默认值: None

to_datetime

配置到 datetime 的转换。

static to_datetime(formats: str | List[str], date_constant: str | None = None)

参数

名称 说明
formats
必需
strlist[str]

尝试日期/时间转换的格式。 例如 ,%d-%m-%Y “天-月”中的数据,%Y -%m-%dT%H:%M:%S. 根据 ISO 8601 的“合并日期和时间表示形式”%f。

  • %Y:包含 4 位数字的年份

  • %y:包含 2 位数字的年份

  • %m:月份(以数字为单位)

  • %b:月用 3 个字母表示,如 8 月

  • %B:以全名表示的月份,如八月

  • %d:数字天

  • %H:以 24 小时制时间表示的小时

  • %I:以 12 小时制时间表示的小时

  • %M:以 2 位为单位的分钟数

  • %S:2 位数字中的秒

  • %f:微秒

  • %p:AM/PM 设计器

  • %z:时区,例如:-0700

date_constant

如果该列仅包含时间值,则应用于生成的 DateTime 的日期。

默认值: None

to_float

配置到 64 位浮点数的转换。

static to_float()

to_int

配置到 64 位整数的转换。

static to_int()

to_stream

配置到流的转换。

static to_stream()

to_string

配置到字符串的转换。

static to_string()