将整个字符串转换为虚拟变量

我有30多个特征,但我需要将其中的两个特征转换为虚拟变量。这两个特征是获胜者和失败者的名称。你可以在下面的照片中看到这些特征。我希望看到这些名称在每行相同位置上的转换为虚拟类型的过程。

我不明白如何使用方法将其转换为虚拟变量。有人能给我一些建议吗?提前谢谢你。你可以在这里找到包含特征的图片,以便你理解我的需求


回答:

@隐藏人名:

方法 pd.get_dummies 应该能解决你的问题。

解决方案

df # 你的DataFrame如图所示# 生成虚拟变量dum_winners = pd.get_dummies(df.Winner, prefix="win", prefix_sep=" ")dum_losers = pd.get_dummies(df.Loser, prefix="los", prefix_sep=" ")# 使用虚拟变量更新dfdf = pd.concat([df, dum_winners, dum_losers], axis=1)\    .drop(columns=["Winner", "Loser"])

上述解决方案的输入为:

   Other Features    Winner     Loser0               2   John D.  Jason S.1               4  Jason S.   Eric N.

输出为:

   Other Features  win Jason S.  win John D.  los Eric N.  los Jason S.0               2             0            1            0             11               4             1            0            1             0

详细信息

这里是文档链接:

  • concat 用于合并DataFrame:链接
  • get_dummies 用于生成一个热编码矩阵:链接

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注