如何使用神经网络在子字符串中找到主要部分?

我现在很困惑。是否有可能通过训练集在句子中找到主要的词或子字符串?我正在解析职位空缺,并试图构建一个文本挖掘应用程序,能够猜测文本中提到的技能。是的,也许这是一个使用技能词典进行全局文本搜索的任务,但我真的很好奇,神经网络能帮上忙吗?正如你所猜到的,我在机器学习方面是个新手。


回答:

Word2Vec 是神经网络的一个基本应用,可以帮助创建词的数值表示,你可以用它来构建对句子的智能解释。

更有趣的是,使用 LSTM 可以处理上下文,并识别句子中的关键词,就像这篇论文中所做的那样:http://www.clsp.jhu.edu/~guoguo/papers/icassp2015_myhotword.pdf。这篇论文是关于识别句子中的关键词,以实现语音识别软件更快、更有用的应用。这里是 GitHub 链接:https://github.com/MajerMartin/lstm-dtw-keyword-spotting。在本文中解释这些内容太多了,但这应该能让你忙起来,并开始训练神经网络进行关键词识别。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注