使用Keras分割输入

我正在尝试使用Keras来识别英语单词中的常见模式。目前，我只是将整个单词输入到神经网络中。这样做不好，因为只有长单词才会使用到末端的神经元。

有没有一种方法可以基于对多个数据片段的运行来进行预测？

我想做的是

word = "check"scores = []for segment in binify(word, binsize=4):    # 我们得到 " che", "chec", "heck", "eck "    scores.append(model.predict(segment))final_classification = mean(scores)

我想训练一个神经网络（网络每次处理4个字符），使用上述描述的函数。如何最好地做到这一点？需要自定义优化器吗？

回答：

有没有一种方法可以基于对多个数据片段的运行来进行预测？

为什么不直接按你需要的方式预处理数据呢？即将其分成多个部分，然后将这些数据输入到网络中？实际上，正如你在算法中所描述的那样。我认为没有必要让神经网络执行这一步。如果你想要一个专注于单词部分的神经网络，卷积神经网络（CNNs）是可行的选择。但我认为CNNs对你的任务不会有帮助。

因为如果我理解正确的话，你试图构建一种自动补全功能（但自动补全器会在输入单词的两端进行补全？）所以输入“che”的标签是“check”，对吗？基本问题在于，例如，“heck”可能对应于check、checkpoint、heck、check-in…所以从输入到标签之间从来没有明确的区分。

我建议使用字符嵌入作为输入，因为它们能模拟字符的相似性。作为一种简单的方法，你也可以使用独热编码的字符。在隐藏层中可以尝试一些有趣的东西——你可以先使用一个简单的全连接Dense层，也可以尝试LSTM。作为标签，你可以使用word2vec词嵌入。因此，作为输出层，你需要300个神经元（word2vec的维度是300）。因为它不再是独热编码的——你不应该使用交叉熵损失，而应该使用平方损失或类似的损失函数。

Word2vec已经提供了开箱即用的工具来比较给定向量与相似词。这就是你如何获得预测的单词的方法。

学技术

使用Keras分割输入

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复