背景:我正在构建一个基于机器学习模型的杀毒软件。我编写了一个程序,生成一个包含486个值的列表(向量)。
例如,这是简化版本的外观(实际向量有486个值):
[1.00000000e+00 1.00000000e+00 1.00000000e+00 0.00000000e+00 1.00000000e+00 1.00000000e+00 1.00000000e+00 1.00000000e+00 1.00000000e+00 1.00000000e+00 1.00000000e+00 5.33333333e-01 0.00000000e+00 5.88235294e-02 3.49019608e-01 7.96078431e-01 5.88235294e-02 3.49019608e-01 8.07843137e-01 5.88235294e-02 3.45098039e-01 9.45098039e-01 5.88235294e-02 1.56862745e-01 8.00000000e-01 5.88235294e-02 7.60784314e-01 5.09803922e-02 2.50980392e-01 3.92156863e-03 5.33333333e-01 0.00000000e+00 2.35294118e-02 5.88235294e-02 3.13725490e-01 7.56862745e-01 5.88235294e-02 3.41176471e-01 9.49019608e-01 5.21568627e-01 7.52941176e-01 4.58823529e-01 2.78431373e-01 2.00000000e-01 1.00000000e+00 5.21568627e-01 1.00000000e+00 4.58823529e-01 5.88235294e-02 5.88235294e-02 1.56862745e-01 7.76470588e-01 5.05882353e-01 7.68627451e-01 9.72549020e-01 0.00000000e+00 0.00000000e+00 0.00000000e+00 3.56862745e-01 3.72549020e-01 5.45098039e-01 8.98039216e-01 3.64705882e-01 7.64705882e-01 5.88235294e-02 1.60784314e-01 1.56862745e-02 1.41176471e-01 5.88235294e-02 1.60784314e-01 4.54901961e-01 1.41176471e-01 2.50980392e-01 4.54901961e-01 9.01960784e-01 1.45357859e-01 1.27626518e-02 5.25954600e-03 5.29496962e-03 1.07052096e-02 3.08893971e-03 3.26031344e-03 2.54954328e-03 9.53584717e-03 1.62738028e-03 4.26500391e-03 1.86711202e-03 6.17443280e-03 2.24815529e-03 1.28635612e-03 1.18420206e-02 1.02462344e-02]
我完成了模型的构建,使用了一个从每行提取数据的xlsx文件作为数据库。
问题:现在我试图预测一个文件是否是病毒,我为该文件构建了一个向量,并尝试使用model.predict(pe)
函数(pe是我的向量),但我得到一个错误,说我的向量与期望的形状不匹配:
' but received input with shape ' + str(shape))ValueError: Input 0 of layer sequential is incompatible with the layer: expected axis -1 of input shape to have value 486 but received input with shape [None, 1]
这是我的代码:
from tensorflow import kerasimport vector_build #custom code that I mademodel = keras.models.load_model("anti_virus_model.h5")pe = vector_build.encode_pe("C:\\Windows\\System32\\calc.exe")print(model.predict(pe))
我不知道该怎么做,也不知道如何改变向量的形状。可能是我从xlsx文件中提取数据时,它没有识别为相同的格式向量?
如果您需要我添加任何内容以便更清楚,请告诉我!
很想听听您的想法!提前感谢!
回答:
你可能是在批量数据上训练你的模型的吧?也就是说,你的输入形状是[batch_size, 486]
。Keras模型总是期望输入有一个批量轴,即使它是一个单一的例子。因此,请确保输入有一个批量轴。
目前(我假设),你的输入只是形状[486]
,即它没有批量轴——你只需要添加一个。你可以这样做:model.predict(pe[None])
。这会在前面添加一个大小为1的轴,使输入形状变为[1, 486]。