Bfloat16 在 GPU 上的训练

大家好,我正在尝试使用新的 bfloat16 数据类型变量来训练模型。我知道这在 Google 的 TPU 上是支持的。我想知道是否有人尝试过在 GPU 上(例如 GTX 1080 Ti)进行训练。这是可能的吗?GPU 的张量核心是否支持?如果有任何经验,请分享您的想法。非常感谢!


回答:

我曾在 Tensorflow 的 GitHub 社区中发布了这个问题。这是他们迄今为止的回应 – “对 GPU 的 bfloat16 支持尚未完成,因为设备本身并不原生支持这种数据类型。

为了获得更好的性能,您应该在 GPU 上使用 float32 或 float16(尽管使用 float16 训练模型可能比较困难)。TPU 支持 bfloat16 用于几乎所有操作(但您目前需要将模型迁移到 TPU 上运行)。”

Related Posts

关于k折交叉验证的直观问题

我在使用交叉验证检查预测能力时遇到了一些直观问题,我认…

调整numpy数组大小以使用sklearn的train_test_split函数?

我正在尝试使用sklearn中的test_train_…

如何转换二维张量和索引张量以便用于torch.nn.utils.rnn.pack_sequence

我有一组序列,格式如下: sequences = to…

模型预测值的含义是什么?

我在网上找到一个数字识别器的CNN模型并进行了训练,当…

锯齿张量作为LSTM的输入

了解锯齿张量以及如何在TensorFlow中使用它们。…

如何告诉SciKit的LinearRegression模型预测值不能小于零?

我有以下代码,尝试根据非价格基础特征来估值股票。 pr…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注