Keras Tokenizer: 如何禁用字典中的元素?

t = Tokenizer(num_words=50000)tokenizer.fit_on_texts(trainText)my_items = list(tokenizer.word_index.items())  

我需要按顺序禁用字典中每100个元素的区块,并检查禁用特定区块对网络准确性的影响。如何禁用,比如说,前100个字典元素呢?在我的案例中,my_items的大小是140000。我只需要使用前50000个元素。


回答:

下面是一个函数,给定一个输入的词索引,会返回一个新的词索引,这个新索引与原始词索引相同,但排除了从start_number到end_number的条目。

my_dict={} #创建一个字典,其中值为整数for i in range (10):    my_dict[i]=i# 函数返回一个与输入字典相同的字典,但缺少从start_number到end_number的条目def dump_words(word_index, start_number, end_number):    temp_dict={}    new_dict={}    for key, value in word_index.items():        if value<start_number or value>end_number:            temp_dict[key]=value    # 现在重新编号字典中的值     for key, value in temp_dict.items():        if value<start_number:            new_dict[key]=value        else:            new_dict[key]=value-end_number    return new_dictnew_dict=dump_words(my_dict, 1, 5)for key, value in new_dict.items():    print (key,value)    # 打印输出显示字典条目0到4被删除

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注