Home IT技术 Apple Vision图像识别

Apple Vision图像识别

IT技术 xiaolong · 2025年4月13日 · 0 Comment

和其他许多开发者一样，我已经深入研究了苹果的新ARKit技术。这非常棒。然而，对于一个特定的项目，我希望能够识别场景中的真实图像，以便在其上投影某些内容（就像Vuforia对其目标图像所做的那样），或者用它来触发应用程序中的事件。

在研究如何实现这一点的过程中，我偶然发现了苹果的Vision和CoreML框架。这看起来很有前景，尽管我还没有完全理解它。

据我所知，我应该能够通过使用Vision框架查找矩形，并将这些矩形输入到一个CoreML模型中，模型会简单地将其与我在模型中预定义的目标图像进行比较。然后，它应该能够输出它找到的目标图像是什么。

虽然这在我脑海中听起来不错，但我还没有找到实现它的方法。我应该如何创建这样一个模型，这甚至是可能的吗？

回答：

从ARKit 1.5开始（将于2018年春季随iOS 11.3发布），似乎直接在ARKit之上实现了一个解决此问题的功能。

ARKit将完全支持图像识别。一旦识别出图像，就可以获取其3D坐标作为锚点，从而可以在其上放置内容。

apple-vision arkit augmented-reality machine-learning swift

发表回复取消回复