sklearn使用函数文档
train_test_split
作用
- 将数据集切分为测试集和训练集
 
用法
from sklearn.model_selection import train_test_split
def train_test_split(  | 
参数
*arrays(数量可变)
- 具有相同长度/形状的可索引序列,
 - 可以是列表、numpy 数组、scipy-sparse 矩阵或以上结构的pandas数据类型
 
test_size
- 如果是float,应该在0.0到1.0之间,代表比例要包含在测试拆分中的数据集。 如果是 int,则代表测试样本的绝对数量。 如果没有,则该值设置为训练数据大小。 如果 
train_size也是 None,它会设置为 0.25。 
train_size
- 同test_size
 
random_state
shuffle
- 洗牌
 - 如果shuffle是False,那么stratify也要是None
 
stratify
返回值
- 两个数组
 
versionadded:: 0.16  | 
例子
>>> import numpy as np  | 




