当随机态为非随机态时，分层shufflesplit函数（scikitlearn）的不同结果

import numpy as np import sklearn as skl (...) #skCVs=skl.cross_validation.StratifiedShuffleSplit(classes,n_iter=iterations*kfoldCV,test_size = 1/float(kfoldCV),random_state=5) skCVs=skl.cross_validation.StratifiedShuffleSplit(classes,n_iter=iterations*kfoldCV,test_size = 1/float(kfoldCV)) for train,test in skCVs: (classification, ...)

2条回答

网友

1楼 · 编辑于 2024-10-01 22:42:05

（分层）ShuffleSplit在拆分之前随机洗牌数据。（伪）随机性由random_state构造函数参数控制。默认的None值意味着每个新调用将产生不同的洗牌。要获得确定性洗牌，您可以选择传递一个整数种子。在

网友

2楼 · 编辑于 2024-10-01 22:42:05

我也不是随机生成器的专家，但据我所知，如果不定义random_state，则会调用不同的random state类型。以下是我发现的解释：

“如果seed为None，则RandomState将尝试从/dev/urandom（或Windows模拟）读取数据（如果可用），或者从时钟读取数据。”[1]

如果大小为整数，则返回一个由生成的值填充的一维数组[1]

你可以看到两个不同的随机生成器的代码被调用在“check_random_state”这里[2]。在

[1]http://docs.scipy.org/doc/numpy/reference/generated/numpy.random.RandomState.html

[2]https://github.com/scikit-learn/scikit-learn/blob/0.14.X/sklearn/utils/validation.py

这对你有帮助吗？在

相关问题更多 >

编程相关推荐

热门问题

热门文章