开发一个Python/PySpark程序来展示相似类型的词汇

[code_image….

它应该在单列中打印类似的输出]1>

from fuzzywuzzy import fuzzfrom fuzzywuzzy import processquery = "Apple"#set of DATA 25 recordschoices = ["apil",    "apple",    "Apille",    "aple",    "apil",    "appple",    "Apple APPLE",    "Apil Orange",    "apples"]process.extract(query, choices)#### Printing Accuracy Valueprint ("List of ratios: ")print (process.extract(query, choices), "\n")#process.extractone(query, choices)print ("\nBest among the above list ----->",process.extractOne(query, choices))

输出:

比率列表:

[(‘apple’, 100), (‘appple’, 91), (‘apples’, 91), (‘Apple APPLE’, 90), (‘aple’, 89)]

上述列表中最佳的 —–> (‘apple’, 100)


回答:

我只需更改你代码片段中的一行并添加另一行。你可以在我的注释中找到我所做的更改,这些注释解释了它们的作用。我不确定你想要的输出格式是否完全正确,如果不是你想要的,请随时再次询问。

如果你想深入了解最后一行的工作原理,可以查看列表推导式

from fuzzywuzzy import fuzzfrom fuzzywuzzy import processquery = "Apple"#set of DATA 25 recordschoices = ["apil",    "apple",    "Apille",    "aple",    "apil",    "appple",    "Apple APPLE",    "Apil Orange",    "apples"]# 第一处更改# 下一行将每个选择及其相应的相似度测量值存储为元组的列表。这些条目似乎是按你的代码片段显示的顺序排列的。ordered_choices = process.extract(query, choices)#### Printing Accuracy Valueprint ("List of ratios: ")print (process.extract(query, choices), "\n")#process.extractone(query, choices)print ("\nBest among the above list ----->",process.extractOne(query, choices))# 第二处更改# 以下行从列表中的每个元组中取第一个元素并将其添加到另一个列表中,然后打印出来。 print("\nOrdered choices: ", [choice for choice, value in ordered_choices])

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注