Home IT技术移除常用词，但当要求返回可理解的内容时该如何操作？

移除常用词，但当要求返回可理解的内容时该如何操作？

IT技术 xiaolong · 2025年4月2日 · 0 Comment

我想知道是否可以通过某种方式（也许使用某种算法）对提交的文本（如下所示）进行概括（删除常用词）

猩红色和蓝色已经出现在俱乐部球衣上超过一百年，并且该俱乐部以“Blaugrana”而广为人知，这是指加泰罗尼亚语中这些颜色的名称。

但当被要求时，要利用保存的数据并返回可理解的内容。也许不是完全相同的内容，而是你容易理解的内容。

这会用到人工智能吗？现在有哪些方法可以做到这一点？

更新（为了澄清）：我想知道计算机如何连接关键词以提供可理解的内容。例如，将"Scarlet, blue, club, shirt"返回为"Scarlet and blue are the club shirt"。

回答：

这里有两个不同的任务：

提取重要的信息。
生成有意义的内容。

为了完成这两个任务，你必须在 (1) 和 (2) 之间使用一些有意义的文本表示。我能想到的最好的选择是使用本体。首先从自由文本中提取事实并将它们放入本体中，然后从这个本体生成文本。类似于这个。无论如何，你需要提取事实，而不是关键词。

algorithm artificial-intelligence information-retrieval php

发表回复取消回复