为了将PoseNet应用于我的健康相关研究工作,我一直在学习PoseNet。
Mobilenet通过调整几个参数就能在保持高精度的同时减少对CPU(或GPU/NPU)的依赖,这让我印象深刻,也引发了我的疑问。
我在mobilenet的官方论文中注意到引入了两个乘数:alpha和rho。我将略过对这两个参数的解释。我想知道最新的PoseNet模型中mobilenet的alpha和rho各是什么值。此外,我想知道是否有关于参数(特别是alpha和rho)调整的指导方针,以及在训练模型之前如何设置和验证这两个值。
例如,如果选择的alpha值为0.5,我想知道为什么这个值比0.75或0.25更好。
我的问题是:
- 用于训练PoseNet的mobilenet版本的alpha和rho的值是多少?
- 这些数值是如何选择和验证的?
回答:
https://www.tensorflow.org/lite/models/pose_estimation/overview 中使用的alpha值为1.0。alpha乘以每个卷积层的输入/输出通道数,当alpha为1.0时,第一层卷积有32个通道。尽管如此,还有使用其他骨干网络的PoseNet,你可以从TF.js的示例中轻松尝试。https://github.com/tensorflow/tfjs-models/tree/master/posenet
rho值在理论上更为复杂,原始论文中提到
在实践中,我们通过设置输入分辨率来隐式设置ρ。