我想使用AlexNet架构来解决一个回归问题,该架构最初是用于分类任务的。此外,在学习步骤中,我想加入一个批量大小参数。
因此我有几个问题:
- 为了实现回归,我需要在网络架构中做哪些改变?特别是在最后一层、损失函数或其他方面。
- 如果我使用批量大小为5,那么最后一层的输出大小是多少?
谢谢!
回答:
分享以下信息会很有帮助:
-
Q 框架: 您正在使用哪个深度学习框架和/或分享您需要帮助修改的特定代码片段
A: 例如,TensorFlow, PyTorch, Keras等。
-
Q 损失类型,输出大小: 您试图通过回归实现什么任务?这将影响您想要使用的损失类型、输出维度、对VGGnet的微调等。
A: 例如,灰度图像的自动着色(这里有一个例子)是一个回归任务的例子,您将尝试从单色图像回归RGB通道像素值。您可能会使用L2损失(或其他一些损失以提高性能)。输出大小应该与批量大小无关,它将由最终层的输出维度决定(即
prediction op
)。批量大小是一个训练参数,您可以更改它而无需更改模型架构或输出维度。