我想开始在Python中尝试使用AI工具。我已经查看了几个项目,但发现它们的示例对于我的有限经验来说太过复杂。例如,我想构建一个方法来比较两个HTML表格,并构建一个能够让我判断这些表格是否描述相同概念的工具。目前,我使用的是蛮力方法,例如,我有一组已知的特定类型的表格。我找到并提取所有行标签,并创建一组唯一的行标签。然后,我拿一个新表格,将新表格中的行标签与这组行标签进行比较,如果行标签的交集足够大,我就将其声明为该特定类型的表格。
然而,我的阅读表明我应该能够做一些不那么机械而更有艺术性的工作,但我不知道如何开始。
有谁能指引我找到一些资源,这些资源中包含了使用AI工具解决特定问题的可访问示例吗?例如,假设我在文档中遇到一个表格,我想看看这个表格是否是我已经识别出的几种表格类型之一。我如何传递示例表格和候选表格进行检查?我如何指定应该考虑的表格属性?
当我查看AI资源的文档和示例时,我发现它们过于笼统,以至于我不知道如何开始。
我在阅读FAQ后添加了上述内容,我认为这是一个合理的问题。我不想让某人编写pyBrain代码来读取我的样本表格,我是想找到其他人使用过该工具或类似工具的案例,以便我可以研究他们的代码。
谢谢
在问题被关闭后我编辑了这段内容。从问题的流量来看,它似乎是相关的。NLTK是一个很好的起点。我在弄清楚它将是一个很好的资源后,从iTunes上获取了这本书的电子版。如果你需要在购买前浏览这本书,整个内容都在线上可以找到NLTK书籍,但如果你觉得有用,请购买这本书。
回答:
David Robinson建议使用朴素贝叶斯分类器来解决你的问题。这是很好的建议。查看nltk.classify模块,了解NB分类器和其他分类器的实现。