我想知道是否可以通过某种方式(也许使用某种算法)对提交的文本(如下所示)进行概括(删除常用词)
猩红色和蓝色已经出现在俱乐部球衣上超过一百年,并且该俱乐部以“Blaugrana”而广为人知,这是指加泰罗尼亚语中这些颜色的名称。
但当被要求时,要利用保存的数据并返回可理解的内容。 也许不是完全相同的内容,而是你容易理解的内容。
这会用到人工智能吗? 现在有哪些方法可以做到这一点?
更新(为了澄清):我想知道计算机如何连接关键词以提供可理解的内容。 例如,将"Scarlet, blue, club, shirt"
返回为"Scarlet and blue are the club shirt"
。
回答:
这里有两个不同的任务:
- 提取重要的信息。
- 生成有意义的内容。
为了完成这两个任务,你必须在 (1) 和 (2) 之间使用一些有意义的文本表示。 我能想到的最好的选择是使用本体。 首先从自由文本中提取事实并将它们放入本体中,然后从这个本体生成文本。 类似于这个。 无论如何,你需要提取事实,而不是关键词。