我在Keras中创建了一个自定义回调,用于在每个epoch结束时获取嵌入向量。它确实将向量保存到.tsv文件中,但由于文件名在每个epoch不更新,导致每次都重写第一个文件。因此,训练结束时,我只能得到最后一个epoch的向量。我需要一种方法在.tsv文件名中添加epoch编号,但我不知道如何实现。
代码如下:
import io
encoder = info.features['text'].encoder
class CustomCallback(keras.callbacks.Callback):
def on_epoch_end(self, epoch, logs=None):
out_v = io.open('vecs.tsv', 'w', encoding='utf-8')
vec = model.layers[0].get_weights()[0]
out_v.write('\t'.join([str(x) for x in vec]) + "\n")
out_v.close()
任何建议都将不胜感激。非常感谢!
回答:
你可以通过更改以下内容来实现这一点:
out_v = io.open('vecs_{}.tsv'.format(epoch), 'w', encoding='utf-8')
文件名将是vec_1.tsv、vec_2.tsv等等。