你好,我对用于确定句子中词语上下文的API很感兴趣
自从我看到情感聚合器的出现——这些脚本试图评估句子的情感——我就一直在思考这种技术的更复杂版本。基本上,我所见到的情感聚合器实际上非常简单,它们只是试图为句子分配正面和负面的值,但仍然不知道上下文。同样,我对机器检测上下文的当前进展感到失望
我在想,一个更复杂的算法会为一个词分配更多的属性,并将它们与其他词进行比较
例如:
The quick brown fox jumped over a lazy dog.
词语“fox”会被解释为一个对象
{ word: fox, type: noun, relation: ...}
现在它知道“fox”是指哺乳动物,而不是“迷惑或欺骗”的动词,这对于翻译成另一种语言或为机器人判断一个好的回应非常有用
有没有好的API或开源项目可以做到这一点?
回答:
对于高级情感分析,一个可能的步骤是找出每个词的词义以及词与词之间的依赖关系。一旦你有了这些信息,你可以做很多事情。例如,你可以处理否定,利用父类(更广泛的概念)来平滑词义等。你还可以超越简单的喜欢/不喜欢,识别针对性的意图或话题(例如,暴力,非法活动等)。正确检测词义的能力可以消除很多噪音。(例如,词语“like”在“Like others, I’ve …”中并不传达情感。)