我见过的所有神经网络示例都是针对固定的输入集,这对于图像和固定长度的数据效果很好。如何处理可变长度的数据,例如句子、查询或源代码?是否有一种方法可以将可变长度的数据编码为固定长度的输入,并且仍然获得神经网络的泛化特性?
回答:
通常,你需要从数据中提取特征,然后将这些特征输入到网络中。不建议直接将一些数据输入到网络中。在实践中,预处理和选择正确的特征将决定你的成功和神经网络的性能。不幸的是,恕我直言,培养对这方面的感觉需要经验,而不是可以从书中学习到的。
总结:“垃圾进,垃圾出”
我见过的所有神经网络示例都是针对固定的输入集,这对于图像和固定长度的数据效果很好。如何处理可变长度的数据,例如句子、查询或源代码?是否有一种方法可以将可变长度的数据编码为固定长度的输入,并且仍然获得神经网络的泛化特性?
回答:
通常,你需要从数据中提取特征,然后将这些特征输入到网络中。不建议直接将一些数据输入到网络中。在实践中,预处理和选择正确的特征将决定你的成功和神经网络的性能。不幸的是,恕我直言,培养对这方面的感觉需要经验,而不是可以从书中学习到的。
总结:“垃圾进,垃圾出”