Home IT技术 LibriSpeech数据集的dev-clean文件夹

LibriSpeech数据集的dev-clean文件夹

IT技术 xiaolong · 2025年5月28日 · 0 Comment

我正在研究LibriSpeech的Dev-Clean数据集。我无法理解数据集的结构。我了解到dev-clean文件夹下的84、1272等目录代表的是说话者的ID。但是子文件夹代表什么呢？

我的意思是，如果我们查看dev-clean文件夹下的1272目录，它又被分为三个文件夹，即128104、135031、141231。

这对我来说似乎有些模糊。有什么想法吗？

回答：

Librispeech是由一定数量的说话者朗读的有声书制作而成。1272是说话者的ID。128104、135031、141231是书籍的ID。每个文件夹内都有与特定书籍相关的录音。

computer-vision deep-learning machine-learning speech-recognition transfer-learning

发表回复取消回复