文本分类与特征选择的区别

我们能否在不进行分类的前提下选择特征?如果我有一段文本,我怎样知道应该选择哪些特征?我需要关于文本的例子,而不是现实世界的对象例子。如果有人能解释一下,请告知?


回答:

文本分类是根据文本的特征对其进行分类。例如,你可能会将一个句子分类为具有积极情感(“我很开心”)或消极情感(“我很伤心”)。

文本特征选择有效地决定了你希望如何对文本进行编码,以便通过分类器运行。有很多方法可以做到这一点。例如,你可以使用词袋表示法,其中每一列代表词汇表中的一个词,每个单元格代表该词在文档中出现的次数。

如果你有两个句子,“我很开心,非常开心”和“我很伤心”,你对这些句子的编码可能会是

| 我 || 是 | 很 | 开心 | 非常 | 伤心 |

            1. 0.
            1. 1.

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注