移除常用词,但当要求返回可理解的内容时该如何操作?

我想知道是否可以通过某种方式(也许使用某种算法)对提交的文本(如下所示)进行概括(删除常用词)

猩红色和蓝色已经出现在俱乐部球衣上超过一百年,并且该俱乐部以“Blaugrana”而广为人知,这是指加泰罗尼亚语中这些颜色的名称。

但当被要求时,要利用保存的数据并返回可理解的内容。 也许不是完全相同的内容,而是你容易理解的内容。

这会用到人工智能吗? 现在有哪些方法可以做到这一点?

更新(为了澄清):我想知道计算机如何连接关键词以提供可理解的内容。 例如,将"Scarlet, blue, club, shirt"返回为"Scarlet and blue are the club shirt"


回答:

这里有两个不同的任务:

  1. 提取重要的信息。
  2. 生成有意义的内容。

为了完成这两个任务,你必须在 (1) 和 (2) 之间使用一些有意义的文本表示。 我能想到的最好的选择是使用本体。 首先从自由文本中提取事实并将它们放入本体中,然后从这个本体生成文本。 类似于这个。 无论如何,你需要提取事实,而不是关键词

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注