自然语言查询处理

我有一个自然语言处理应用程序在运行，它会给我一个解析句子的树结构，问题是接下来我应该如何处理这个树结构。

What is the time-SBAR - 从属子句  |-WHNP - Wh-名词短语  | \-WP - Wh-代词  |  \-What  \-S - 简单陈述句   \-VP - 动词短语     |-VBZ - 动词，第三人称单数现在时     | \-is     \-NP - 名词短语       |-DT - 限定词       | \-the       \-NN - 名词，单数或不可数         \-time

该应用程序内置了JavaScript解释器，我试图将短语转换为简单的函数，例如

function getReply() {   return Resource.Time();}

简单来说，what（什么）等于请求，创建函数，is（是）将是返回的对象，而time（时间）将引用时间。现在，只需为此创建一个简单的解析器就很容易，但我们也可能遇到“现在几点”或“你知道现在几点吗”这样的句子。我需要它能够基于英语语言进一步发展，因为项目会增长。

源代码是C# .Net 4.5

提前感谢。

回答：

据我所见，使用依赖解析树会更有帮助。通常，提问的方式是有限的（我的意思是统计上有意义的变化是有限的…可能会有一些人们通常不用的极端情况），这些问题通过像who（谁）、what（什么）、when（何时）、where（在哪里）、why（为什么）和how（如何）这样的词来表达。

依赖解析将使你能够提取查询中的名词主语以及直接和间接宾语。通常，这些将表达查询的基本意图。考虑两个等价查询的例子：

几点了？
你知道现在几点吗？

它们的依赖解析结构如下：

root(ROOT-0, What-1)cop(What-1, is-2)det(time-4, the-3)nsubj(What-1, time-4)

和

aux(know-3, Do-1)nsubj(know-3, you-2)root(ROOT-0, know-3)dobj(is-7, what-4)det(time-6, the-5)nsubj(is-7, time-6)ccomp(know-3, is-7)

两者都是what-查询，并且都包含“time”作为名词主语。后者还包含“you”作为名词主语，但我认为像“do you know”、“can you please tell me”等表达可以基于启发式方法去除。

你会发现斯坦福解析器对这种方法很有帮助。他们还有这个在线演示，如果你想看到更多工作中的例子。

学技术

自然语言查询处理

发表回复取消回复

相关文章：

当走到迷宫死胡同时，如何以编程方式遍历迷宫

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复