我是机器学习的新手,对于训练/测试过程中数据的读取方式有点困惑。假设我的数据与日期有关,我希望模型先读取较晚的日期,然后再读取较新的日期,数据是以最早的日期存储在line 1
,而line n
存储最晚的日期。我假设数据自然是从line 1
向下读取到line n
,但我只是想确认一下。还有,我能否让模型(例如逻辑回归)按照我想要的任何方向读取数据?
回答:
在监督学习方法中,机器学习模型从所有样本中学习,没有特定的顺序,建议在训练过程中对样本进行shuffle(随机重排)。
大多数情况下,模型不会一次性处理所有样本;训练集会被分成批次,这些批次可能是随机样本的集合,或者只是按照训练集中原有的顺序排列。