我是机器学习的新手,但我具备基本的编程知识。
我刚完成了fast.ai课程,并且知道如何使用Google Colab。
但是我仍然不知道如何在Colab上运行这个项目。
我刚创建了一个新的笔记本,并设置了环境,
我运行了
from google.colab import drivedrive.mount('/content/drive')import keras!git clone https://github.com/andabi/deep-voice-conversion
在我的笔记本中,它将所有文件复制到了我的Google Drive中,但我不知道下一步该做什么。
回答:
根据GitHub上的要求,你应该安装并导入以下库,而不仅仅是Keras(实际上它并没有提到你需要Keras!它明确提到了Tensorflow,不过如果你修改代码的话,可以使用Keras):
- Tensorflow >= 1.1
- Numpy >= 1.11.1
- Librosa == 0.5.1
你可以观看这些视频,了解如何在不到2分钟内在Colab中安装库:
在Google CoLab中安装TensorFlow 2.0和GPU
在Google Colaboratory中开始使用TensorFlow(编码TensorFlow)
# 开始导入库并遵循下一步from google.colab import drivedrive.mount('/content/drive')import numpy as npimport tensorflow as tfimport kerasimport liborsa...
步骤:
- 训练阶段:Net1和Net2应按顺序进行训练。
- 训练1(训练Net1)
- 运行train1.py进行训练,并运行
eval1.py
进行测试。
- 运行train1.py进行训练,并运行
- 训练2(训练Net2)
- 运行
train2.py
进行训练,并运行eval2.py
进行测试。- 训练2必须在训练1完成后进行!
- 运行
- 训练1(训练Net1)
-
转换阶段:向前传递到Net2
- 运行
convert.py
以获取结果样本。 - 查看Tensorboard的音频标签来听取样本。
- 查看Tensorboard的图像标签上的音素分布可视化。
- x轴表示音素类别,y轴表示时间步长
- x轴的第一个类别表示静音。
- 运行
注意 别忘了查看Readme.md
文件,它会给你很好的指导。