我刚开始学习语音识别,想了解一下训练Python的SpeechRecognition库的一般流程:
https://pypi.python.org/pypi/SpeechRecognition/
我了解基本的机器学习技术和基础的文本分析,但我不知道如何将这些应用于训练声音数据。(我的最终目标是实现类似于手机上的语音输入功能,如果你经常更改语音分析结果,它会“记住”用户的偏好)。
谢谢!
回答:
该语音识别库使用的是Google的语音识别引擎,因此在用户端没有特别的训练机制。你的声音数据会以摘要形式发送到Google。如果你获得了专用的API(如该文档页面所建议),Google可能会基于此建立一个特定于用户的语音档案,并随着时间的推移在统计质量上有所提升,但这些数据不会存储或写入到你的本地端。
如果你有更多问题或未解决的问题,请告诉我。