我一直在尝试训练一个神经网络来识别我拥有的三种类型的标签图像(圆形、矩形和空白)。我使用了这里提供的用于识别数字数据集的示例设置,发现经过一些预处理(如使用滤镜等)后,我的图像预测正确率达到了75%,几乎没有进行任何调整。
我更感兴趣的是了解分类器部分(如下代码)。我还不清楚不同的卷积和层选项的作用以及我可以如何调整它们。是否有人可以提供建议,告诉我可以使用哪些其他卷积或层来尝试提高我的预测准确率,以及这些选项的含义?抱歉我的描述有些模糊,这是我第一次接触神经网络,理解起来有些困难。
nn = Classifier( layers=[ Convolution('Rectifier', channels=12, kernel_shape=(3, 3), border_mode='full'), Convolution('Rectifier', channels=8, kernel_shape=(3, 3), border_mode='valid'), Layer('Rectifier', units=64), Layer('Softmax')], learning_rate=0.002, valid_size=0.2, n_stable=10, verbose=True)
回答:
我推荐Hugo Larochelle在Youtube上的优秀视频课程。第九章是关于卷积网络的,解释了所有参数。你可以从前两章开始,它们解释了神经网络的总体工作原理,你会熟悉像softmax
和rectifier
这样的术语。
另一个很好的资源:Andrej Karpathy的讲义笔记