在Watson图像识别(IR)演示中,您可以向应用程序提供一张图片,它会对图片进行分类,并告诉您它认为图片中有什么内容。这是如何实现的呢?
据我从文档中了解到的,您只能提供正面和负面的图片,它只能说“是”,这是披萨,或者“不是”,这不是披萨。它无法具体说明是披萨还是意大利面。
有没有办法实现这一点呢?
回答:
该服务通过使用一组分类器来工作;每个分类器仅用于一个标签,并且必须用其自身的正面和负面图片集进行训练。要区分披萨和意大利面,您必须创建两个分类器,并用正面和负面图片分别训练每个分类器。(然而,在这种特定情况下,披萨的负面图片可以是意大利面的正面图片,反之亦然。)
有一个默认的分类器集合可用,涵盖了相当广泛的标签,所有这些标签都是以这种方式训练的;我相信演示使用了该默认集合与AlchemyVision的组合(后者具有更广泛的分类,但不可训练)。您可以在GitHub上查看演示的源代码。
您可以在视觉识别服务文档中阅读更多内容:http://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/doc/visual-recognition/index.shtml