Home IT技术 Bfloat16 在 GPU 上的训练

Bfloat16 在 GPU 上的训练

IT技术 xiaolong · 2025年5月1日 · 0 Comment

大家好，我正在尝试使用新的 bfloat16 数据类型变量来训练模型。我知道这在 Google 的 TPU 上是支持的。我想知道是否有人尝试过在 GPU 上（例如 GTX 1080 Ti）进行训练。这是可能的吗？GPU 的张量核心是否支持？如果有任何经验，请分享您的想法。非常感谢！

回答：

我曾在 Tensorflow 的 GitHub 社区中发布了这个问题。这是他们迄今为止的回应 – “对 GPU 的 bfloat16 支持尚未完成，因为设备本身并不原生支持这种数据类型。

为了获得更好的性能，您应该在 GPU 上使用 float32 或 float16（尽管使用 float16 训练模型可能比较困难）。TPU 支持 bfloat16 用于几乎所有操作（但您目前需要将模型迁移到 TPU 上运行）。”

amd-gpu deep-learning machine-learning tensorflow training-data

发表回复取消回复