是否有任何开源引擎项目可以对在线文本或文章进行分类,或者检查两篇文章的相似性?
例如1.我有十篇不同的文本或文章。然后引擎能够将这些文章分类到不同的领域,如体育、娱乐、政治。
2.两篇文章描述了同一事件。引擎能够将它们放在一起,视为同一篇文章。
谢谢
回答:
你可以尝试使用 Alchemy API。虽然不是开源,但有免费使用层。对于你的例子1,他们的专题分类和概念标记可能会有用。对于例子2,任何分类器如贝叶斯、朴素贝叶斯等都可以使用,尽管需要训练。Weka 也是一个广泛使用的工具。
是否有任何开源引擎项目可以对在线文本或文章进行分类,或者检查两篇文章的相似性?
例如1.我有十篇不同的文本或文章。然后引擎能够将这些文章分类到不同的领域,如体育、娱乐、政治。
2.两篇文章描述了同一事件。引擎能够将它们放在一起,视为同一篇文章。
谢谢
回答:
你可以尝试使用 Alchemy API。虽然不是开源,但有免费使用层。对于你的例子1,他们的专题分类和概念标记可能会有用。对于例子2,任何分类器如贝叶斯、朴素贝叶斯等都可以使用,尽管需要训练。Weka 也是一个广泛使用的工具。