sklearn使用函数文档
train_test_split
作用
- 将数据集切分为测试集和训练集
用法
from sklearn.model_selection import train_test_split
def train_test_split( |
参数
*arrays(数量可变)
- 具有相同长度/形状的可索引序列,
- 可以是列表、numpy 数组、scipy-sparse 矩阵或以上结构的pandas数据类型
test_size
- 如果是float,应该在0.0到1.0之间,代表比例要包含在测试拆分中的数据集。 如果是 int,则代表测试样本的绝对数量。 如果没有,则该值设置为训练数据大小。 如果
train_size
也是 None,它会设置为 0.25。
train_size
- 同test_size
random_state
shuffle
- 洗牌
- 如果shuffle是False,那么stratify也要是None
stratify
返回值
- 两个数组
versionadded:: 0.16 |
例子
>>> import numpy as np |