寻找人工智能(AI)菜谱阅读器研究

我正在寻找关于使用人工智能技术阅读菜谱的研究(已发表的)。菜谱是一个非常有限的领域,或许可以在自然语言识别引擎中以一定的准确度实现。

我想编写一个程序,允许将网页浏览器中的菜谱复制/粘贴到人工智能程序中,并让它通过“阅读”菜谱来确定标题、作者、配料、说明、营养信息等。我还希望能够处理 PDF 文件(我拥有大量收藏),也许也可以直接使用复制/粘贴。

输出将是某种(标准)基于 XML 的格式,可以被菜谱管理器读取。

我想到了博士或硕士级别的研究。


回答:

你可能会发现人工智能的一个相关子领域是 信息抽取

信息抽取算法通常使用规则(例如正则表达式)来识别文本中的实体和关系。这些规则可以手动定义(即 Suiseki 算法),也可以使用监督机器学习算法学习(即 RAPIER、Wrapper Induction、条件随机场)。


例如,信息抽取算法可以从招聘信息中获取数据:

Job Title: Senior DBMS Consultant
Location: Dallas,TX
Responsibilities: DBMS Applications consultant works with project teams to define DBMS based solutions that support the enterprise deployment of Electronic Commerce, Sales Force Automation, and Customer Service applications.
Desired Requirements: 3-5 years exp. developing Oracle or SQL Server apps using Visual Basic, C/C++, Powerbuilder, Progress, or similar. Recent experience related to installing and configuring Oracle or SQL Server in both dev. and deployment environments.
Desired Skills: Understanding of UNIX or NT, scripting language. Know principles of structured software engineering and project management

…并将其提炼成此模板:

title: Senior DBMS Consultant
state: TX
city: Dallas
country: US
language: Powerbuilder, Progress, C, C++, Visual Basic
platform: UNIX, NT
application: SQL Server, Oracle
area: Electronic Commerce, Customer Service
required years of experience: 3
desired years of experience: 5


@人名 和他在德克萨斯大学奥斯汀分校的团队在信息抽取方面做了一些很棒的工作。 以下是一些可能成为良好起点的参考文献:

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注