我有一个学术项目,需要构建一个应用程序来确定消费者对品牌的“感受”:是积极的、消极的还是中立的。然而,我不知道如何通过代码“读取”英语的样本。例如:
Mrs. Darlie buy me an apple 🙂
与下面的句子形成对比:
I Liked Darlie so much and it wake me up every early morning
从人类的常识来看,我们可以注意到第一句话是关于一个“人”的。第一人称描述了一位名叫Mrs. Darlie的女士,但在我的案例中,我只想关注获取品牌名称,这意味着第一句话应该被忽略,专注于第二句话。从这句话中,我们可以确定它是一个对象,很可能描述的是我们每天早上使用的牙膏。
我如何用Python构建这种“常识”?(如果有PHP的例子,我可以尝试将其转换为Python)或者是否有可用的库?另外,请建议一些研究关键词。
回答:
感谢来自安特卫普大学CLiPS计算语言学小组的Tom De Smedt和Walter Daelemans。他们在这篇期刊中解决了我的问题,并在这个网页上提供了示例和完整的源代码。
这个应用程序的概念是首先从社交网站或任何公共网站上爬取相关句子,然后后端连接到Wordnet.org的英语数据库,以确定句子中单词的“类型”或“类别”。接下来使用分类技术进行处理。这真是太棒了!!
感谢您的回复。希望这能帮助到其他人 🙂