在Tensorflow数据集洗牌中BUFFER_SIZE的作用是什么？

我一直在研究这段代码：https://www.tensorflow.org/tutorials/generative/dcgan，对其功能有了很好的理解。然而，我不太明白BUFFER_SIZE变量的作用。我猜测它可能是用来创建一个大小为BUFFER_SIZE的数据库子集，然后从这个子集中提取批次，但我看不出这样做的意义，也找不到有人解释这一点。

所以，如果有人能解释一下BUFFER_SIZE的作用，我将不胜感激 ❤

回答：

它被用作tf.data.Dataset.shuffle中的buffer_size参数。你读过文档吗？

这个数据集会用buffer_size个元素填充缓冲区，然后从这个缓冲区中随机抽取元素，并用新元素替换选中的元素。为了实现完美的洗牌，缓冲区大小需要大于或等于数据集的全部大小。

例如，如果你的数据集包含10,000个元素，但buffer_size设置为1,000，那么洗牌操作最初只会从缓冲区的前1,000个元素中随机选择一个元素。一旦某个元素被选中，它在缓冲区中的位置就会被下一个（即第1,001个）元素替换，从而保持1,000个元素的缓冲区大小。

学技术

在Tensorflow数据集洗牌中BUFFER_SIZE的作用是什么？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复