我一直认为机器学习结果的不同是因为数据每次都会被随机打乱,从而导致不同的训练集。因此,如果不进行打乱,理论上每次的结果应该是一样的。正如sklearn.linear_model.LinearRegression()
的情况那样,但sklearn.linear_model.RANSACRegressor()
即使每次输入相同顺序的训练数据,结果仍然不同。难道它不只是一个数学函数吗?每次的结果不应该都是一样的吗?能有人解释一下吗,或者是我代码里有错误,导致我错误地输入了不同的数据?
回答:
根据文档,数据是被随机选择的。
在一些参数中,如random_state,有这样的提示:
random_state : int, RandomState instance或None,可选,默认
None
用于初始化中心的生成器。如果是int,random_state是随机数生成器使用的种子;如果是RandomState实例,random_state就是随机数生成器;如果是None,随机数生成器是np.random使用的RandomState实例。