我正在研究LibriSpeech的Dev-Clean数据集。我无法理解数据集的结构。我了解到dev-clean文件夹下的84、1272等目录代表的是说话者的ID。但是子文件夹代表什么呢?
我的意思是,如果我们查看dev-clean文件夹下的1272目录,它又被分为三个文件夹,即128104、135031、141231。
这对我来说似乎有些模糊。有什么想法吗?
回答:
Librispeech是由一定数量的说话者朗读的有声书制作而成。1272是说话者的ID。128104、135031、141231是书籍的ID。每个文件夹内都有与特定书籍相关的录音。