我刚刚与一个人交谈,他声称自己开发了一款能够对书面文本进行回答的应用程序。他说,任何人类能读懂和理解的文本,他的应用程序也能做到。由于我并不在AI或NLP领域工作,我很好奇计算机是否能够分析以下文本并回答文末的问题:
我有一些交易记录,具体如下:交易1000,金额为200美元,已被取消,客户需支付30美元的取消费。交易1001,金额为300美元,已获批准。交易1001,金额为500美元,已被作废,但客户愿意支付20美元作为CP(而不是50美元)。
据他所述,他的程序可以回答任何问题,例如:
我们从取消费中赚了多少钱?(应该为30+20=50)
这是可行的吗?
回答:
这是一个活跃的研究领域(一篇关于相关主题的近期博士论文)。简短的回答是:不行。这样做可能需要实现强人工智能。
尽管如此,这个问题近年来越来越受关注。你可能熟悉苹果的Siri(实际上是历史上最大的AI项目之一的成果之一),以及谷歌的Google Now,你也知道它们的局限性(绝对不是因为缺乏努力)。
还有IBM的Watson系统,它能够在智力竞赛节目Jeopardy中击败任何人类玩家。IBM目前正在积极投资这项技术(数十亿美元,新的中心,大量招聘)。
多年来,甚至有尝试实现你所描述的那种问答系统:事实性的,限定在某个领域,有点像高中生的练习题。
最突出的例子包括:
- Allen人工智能研究所的ARISTO项目(由微软联合创始人Paul Allen资助),参见他们关于ARISTO的论文列表。
- Cyc项目 – 一个包含常识事实的大型知识库
- Wolfram Alpha – 这个更侧重于基于策划数据集的一般事实性问答
ARISTO项目起源于HALO项目(由Paul Allen的投资公司Vulcan资助):
Project Halo是Vulcan Inc.的一项分阶段、长期研究工作,旨在开发一个“数字亚里士多德”——一个能够回答新问题并在广泛的科学学科和相关人类事务中解决高级问题的推理系统。该项目专注于创建两个主要功能:一个能够在这些学科中指导和评估学生的导师,以及一个具有广泛跨学科技能的助手,以帮助科学家和其他人在工作中。
为此,他们在2004年举办了一场比赛,挑战如下:
每个团队有四个月的时间独立地将化学教学大纲中的50页内容编码到他们各自的KRR技术平台中。在这段时间结束后,所有系统都被隔离,并向团队发布了一份包含100个大部分是新问题的问题挑战考试。
团队有两周的时间将问题翻译成他们各自的正式逻辑语言。这些翻译作为批处理作业在系统上运行,生成包含英文答案和理由的文档。
最后一步是由三位不同的化学教授进行的公正评估,他们对“考试”进行评分,评估准确性和理由质量。
有三支参赛队伍:Cycorp(德克萨斯州奥斯汀)、SRI International(加利福尼亚州门洛帕克)和Ontoprise(德国卡尔斯鲁厄)。
考试的平均得分为40%到47%正确。将文本翻译成正式符号的平均成本约为每页10,000美元(!)。
《西雅图时报》- Vulcan项目旨在构建“数字亚里士多德”
当然,这是十年前的事情了,自那以后确实有了一些进展(或许最值得注意的是Watson),但我们仍然远未达到即使是领域专注的事实性一般问答的水平。