我想制作一个AI机器人,它只能理解四个单词:“上”、“下”、“左”、“右”。
我的朋友制作了一个Python脚本,通过语音执行一些任务,比如说“YouTube”,Chrome浏览器就会打开youtube.com的网址。但系统很慢,因为他们使用了Google助手/AI来处理语音,这让我感到不耐烦。
然后我想到,如果有一个离线的AI系统,只理解几个单词,我们可以得到一些期望的结果,而且速度会非常快。
例如:我有一辆遥控车,我想让它通过语音控制,当我说“上”时,车应该向前移动,同样,“下”->向后,“左”->向左,“右”->向右,“其他任何声音”->闪烁LED灯以表示系统未能理解
所以:
我应该如何开始?
我应该如何训练AI机器人?
我的需求是什么?
还有其他我应该知道的事情。
回答:
你应该如何开始:阅读;-) 或者我推荐你参加Coursera上的深度神经网络课程。你的问题非常宽泛。
一个针对你问题的临时方法——应该有效——可以是从足够长以包含你的单词但不更长的样本中提取音频频谱。有了这些信息,你可以训练一个卷积神经网络——我会先尝试1D卷积。