如何将字符串转换为数值?

我在jupyter上清理一个csv文件以进行机器学习。然而,有几列包含字符串值,比如“description”列:

enter image description here

我知道需要使用NLP来清理数据,但不知道如何在jupyter上操作。你能建议我如何将这些值转换为数值吗?

谢谢


回答:

数值比文字或图像更适合创建学习模型。(为什么?因为可以进行降维)

常见的机器学习算法期望接收数值输入。

将一个词转换为相应数值的技术称为词嵌入。

词嵌入中,字符串被转换为特征向量(数字)。

可以使用词袋模型、word2vecGloVe来实现这一转换。

通常建议忽略那些对模型不重要的字段。因此,只有在绝对必要时才包含描述信息。

Related Posts

在使用k近邻算法时,有没有办法获取被使用的“邻居”?

我想找到一种方法来确定在我的knn算法中实际使用了哪些…

Theano在Google Colab上无法启用GPU支持

我在尝试使用Theano库训练一个模型。由于我的电脑内…

准确性评分似乎有误

这里是代码: from sklearn.metrics…

Keras Functional API: “错误检查输入时:期望input_1具有4个维度,但得到形状为(X, Y)的数组”

我在尝试使用Keras的fit_generator来训…

如何使用sklearn.datasets.make_classification在指定范围内生成合成数据?

我想为分类问题创建合成数据。我使用了sklearn.d…

如何处理预测时不在训练集中的标签

已关闭。 此问题与编程或软件开发无关。目前不接受回答。…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注