Python – 数据编码向量到词

我有一段将词转换为向量的代码。以下是我的代码:

# word_to_vec_demo.pyfrom gensim.models import word2vecimport logginglogging.basicConfig(format='%(asctime)s : \%(levelname)s : %(message)s', level=logging.INFO)sentences = [['In', 'the', 'beginning', 'Abba','Yahweh', 'created', 'the','heaven', 'and', 'the', 'earth.', 'And', 'the', 'earth', 'was','without', 'form,', 'and', 'void;', 'and', 'darkness', 'was','upon', 'the', 'face', 'of', 'the', 'deep.', 'And', 'the','Spirit', 'of', 'Yahweh', 'moved', 'upon', 'the', 'face',  'of','the', 'waters.']]model = word2vec.Word2Vec(sentences, size=10, min_count=1)print("Vector for \'earth\' is: \n")print(model.wv['earth'])print("\nEnd demo")

输出结果是

Vector for 'earth' is: [-0.00402722  0.0034133   0.01583795  0.01997946  0.04112177  0.00291858-0.03854967  0.01581967 -0.02399057  0.00539708]

是否可以从向量数组编码为词?如果可以,我该如何在Python中实现?


回答:

你可以使用模型中的similar_by_vector()方法来查找与向量最相似的前N个词。希望这对你有帮助。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注