我已经从事全栈web开发15年了,现在想参与到机器学习领域中。我们有一个包含数百万产品的数据库,每个产品都有一张图片。还有一个大约有5000个术语的数据库。
一张产品图片会链接到多个术语(通常是3到20个),并且每个链接还有一个权重(1-100%)。这些术语总是与视觉相关的,即它们描述图片上可视的特征。
目标是上传一张新图片(当然要有主题关联),并根据已分类的图片得到可能的术语(包括概率)的回答。
你有什么建议可以帮助我最好地开始吗?有没有接近这个场景的框架?TensorFlow对于这个任务是否相关?我应该学习哪种新语言?
非常感谢!
回答:
可以使用TensorFlow,不过它比较“底层”。所以如果你刚开始,你可能更适合使用基于TensorFlow后端的Keras,因为它更加用户友好。
关于语言,你可能会使用Python。所以如果你还不熟悉Python,你应该开始学习。在我看来,你也可以在练习时边学边用,因为你已经是一名开发者了。
至于教程,你可能需要从许多不同的教程中挑选出相关部分。你可以从这样的内容开始:
https://www.pyimagesearch.com/2018/05/07/multi-label-classification-with-keras/