我对机器学习这个领域还比较陌生,但我认为我有一个有趣的问题需要解决。我基本上只是想知道一个句子是否符合真或假
这里是一些示例句子:
- 是的,这是我 -> 真
- 这是我 -> 真
- 是的,真的 -> 真
- 这不是我 -> 假
….
现在我需要一些提示,如何在例如Keras、Caffe或其他工具中成功训练模型,以及我应该遵循什么样的原则。
感谢任何提示
更新
据我所知,我需要进行自然语言分类。我需要创建两个类别,并获取每个类别的概率反馈。
像https://github.com/Russell91/nlpcaffe这样的东西有用吗?
回答:
如果我的理解正确的话,你是想将各种类型的回应分类为true
/false
,这些可能是作为对话的一部分对问题的回应。
在这种情况下,你应该创建/拥有一个包含大量true
和false
类别的示例数据集,并训练一个二元文本分类器。你可以阅读关于SVM和朴素贝叶斯的内容,这些对于文本分类非常有效,并且可以使用Scikit-Learn轻松实现。