请考虑以下代码:
#更新 W1 = W1 - learningRate * dJdW1 W2 = W2 - learningRate * dJdW2
其中learningRate是双精度数,dJdW1/dJdW2是二维矩阵。
我得到了这个错误:
错误: 在由第58行和第61行之间的语句块生成的程序块中运行时错误 — 评估指令时出错: CP\xb0-*\xb0W2\xb7MATRIX\xb7DOUBLE\xb01.0E-5\xb7SCALAR\xb7DOUBLE\xb7true\xb0dJdW2\xb7MATRIX\xb7DOUBLE\xb0_mVar117\xb7MATRIX\xb7DOUBLE
编辑 12.7.17:
再加上这个…
ordinal not in range(128)’))
完整的DML可以在这里找到
完整的错误可以在这里找到
完整的Jupyter笔记本可以在这里找到
回答:
逐单元的标量矩阵操作是正常的。从你的错误来看,它表示你的矩阵/向量的维度不兼容:
: 二元单元操作的块大小不匹配: 3x1 vs 2x3 org.apache.sysml.runtime.matrix.data.MatrixBlock.binaryOperations(MatrixBlock.java:2872) org.apache.sysml.runtime.instructions.cp.PlusMultCPInstruction.processInstruction(PlusMultCPInstruction.java:66) org.apache.sysml.runtime.controlprogram.ProgramBlock.executeSingleInstruction(ProgramBlock.java:290)
查看你的笔记本,这个错误来自:
W2 = W2 - learningRate * dJdW2
W2 被初始化为 W2 = rand(rows=hiddenLayerSize,cols=outputLayerSize),是一个3×1的矩阵,而dJDW2是一个2×3的矩阵。