NLP用于从文本中提取动作

我希望有人能指引我学习如何从大量文本中分离出动作。

假设我有这样的文本

Drop off the dry cleaning, and go to the corner store and pick-up a jug of milk and get a pint of strawberries.Then, go pick up the kids from school. First, get John who is in the daycare next to the library, and then get Sam who is two blocks away. By the time you've got thekids, you'll need to stop by the doctors office for the perscription. Tim's flight arrives at 4pm. It's American Airlines flight 331 arriving from Dallas. It will be getting close to rush hour, so make sure you leave yourself enough time.

我试图将其分成以下几部分

Drop off the dry cleaning,
 and go to the corner store and pick-up a jug of milk and get a pint of strawberries.
Then, go pick up the kids from school. First, get John who is in the daycare next to the library, and then get Sam who is two blocks away. 
By the time you've got the kids, you'll need to stop by the doctors office for the perscription.
 Tim's flight arrives at 4pm. It's American Airlines flight 331 arriving from Dallas. It will be getting close to rush hour, so make sure you leave yourself enough time.

在我的搜索中,我没有找到任何专门基于动作的内容。这需要比仅仅挑选动词更智能,因为有时一个动作会与多个动词相关联,例如第二个项目中有’go’、’pick-up’和’get’,但这些都是一个单一动作的一部分。当然,”Tim’s flight”仅通过现在分词暗示了一个动作,动词出现在段落的末尾。

关于如何做这种事情,有什么建议吗?需要注意的事项,推荐的阅读材料等等。


回答:

简单的方法:使用[你喜欢的解析器]解析文本,然后选择那些使用祈使语气的句子或SBAR短语。恰好斯坦福解析器在其最新版本中增加了“改进的祈使句识别”功能。

除了标准解析器程序中已经包含的机器学习之外,可能不需要额外的机器学习。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注