我想配置Stanford Core NLP Lib中的QN-Minimizer,以获得与scipy optimize L-BFGS-B实现几乎相似的优化结果,或者获得一个适用于大多数情况的标准L-BFGS配置。我设置了以下标准参数:
我想复制的Python示例:
scipy.optimize.minimize(neuralNetworkCost, input_theta, method = 'L-BFGS-B', jac = True)
我在Java中尝试做同样的事情:
QNMinimizer qn = new QNMinimizer(10,true) ;qn.terminateOnMaxItr(batch_iterations);//qn.setM(10);output = qn.minimize(neuralNetworkCost, 1e-5, input,15000);
我需要的是一个坚实且通用的L-BFGS配置,适用于解决大多数问题。
我也不确定是否需要为标准L-BFGS配置设置以下这些参数:
useAveImprovement = ?;useRelativeNorm = ?;useNumericalZero = ?;useEvalImprovement = ?;
感谢您的提前帮助,我在这个领域是新手。
信息资源:Stanford Core NLP QNMinimizer:http://nlp.stanford.edu/nlp/javadoc/javanlp-3.5.2/edu/stanford/nlp/optimization/QNMinimizer.html#setM-int-https://github.com/stanfordnlp/CoreNLP/blob/master/src/edu/stanford/nlp/optimization/QNMinimizer.java
Scipy Optimize L-BFGS-B:http://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.minimize.htmlhttp://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.optimize.fmin_l_bfgs_b.html
提前感谢!
回答:
您现在的配置应该没问题。(您实际上遇到过什么问题吗?)
同时设置最大迭代次数和最大函数评估次数来终止可能是多余的,所以您可以省略qn.minimize()
的最后一个参数,但根据文档,scipy默认使用这两个参数,值为15000。
一般来说,使用robustOptions(如您所做的,第二个参数为true
)应该能提供一个可靠的优化器,类似于scipy的pgtol
收敛标准。其它选项适用于特殊情况,或者只是为了试验它们的效果。