我使用Python和Chainer创建了一个简单的逻辑回归模型,但对最终结果不太满意。因此,我想寻求一些帮助。有一个限制:我不希望用已有的功能替换已实现的功能。我知道Chainer中有几乎相同的损失函数,但我正在创建一个更复杂的模型,使用自定义的损失函数。代码在这里:
https://gist.github.com/kmjjacobs/62fc96ece695b47af8d667b060a64559
我希望模型代码尽可能简洁,但如你所见,call方法是损失方法的前向调用,我怀疑在训练循环中调用损失方法有更简洁的方法。我认为如果call方法输出预测结果,并有一个单独的损失方法来计算损失会更清晰。你对此有何看法?
我对转换函数也不是很确定。有没有更好的方法来实现相同的结果?
你对编写Chainer代码有任何评论或最佳实践吗?
提前感谢!
回答:
首先,你的主要问题是什么?是将损失函数和预测函数分开定义的最佳方式吗?
我看了你的代码,我认为init_scope
在Link
和Chain
中的功能是不同的。你不能在Chain
中使用它来注册可学习的参数来达到这个目的。(你当前的使用方式适用于Link
,而不适用于Chain
。)
-
init_scope
在Link
中用于注册参数,https://docs.chainer.org/en/stable/tutorial/function.html#links-that-wrap-functionshttps://github.com/chainer/chainer/blob/master/chainer/link.py#L197 -
init_scope
在Chain
中用于注册其他links
,https://docs.chainer.org/en/stable/tutorial/basic.html#write-a-model-as-a-chainhttps://github.com/chainer/chainer/blob/master/chainer/link.py#L675
在你的情况下,我认为你可以直接在LogisticRegressionModel
中使用chainer.links.Linear
,或者你可以定义自己的Link
类,其中包含可学习的参数W
,并在LogisticRegressionModel
中使用这个自定义的link
类。