产品分类？ – 学技术

有几个关于汽车制造商和型号的数据集。每个数据集包含数百个类似下面的数据条目：

梅赛德斯 GLK 350 W2

普锐斯插电式混合动力高级版丰田

通用汽车别克君威 2012 GS 2.4L

如何仅使用这些文件自动将上述条目分为制造商（例如丰田）和型号（例如普锐斯插电式混合动力高级版）？

提前感谢。

回答：

机器学习（ML）通常依赖于训练数据，这使得ML逻辑能够生成和验证基础数据的模型。有了这个模型，它就可以推断出提交给它的新数据的类别（在分类器应用中，如手头的这个），或者推断出某个变量的值（在回归情况下，比如一个预测某个地区下个月降雨量的ML应用）。

问题中提出的情况在几个层面上令人困惑。
首先，汽车制造商的数量是有限且相对较少的。因此，手动制作这些制造商的列表，然后简单地使用这个词汇表来解析出制造商和型号编号是容易的，只需使用普通的字符串解析技术，即这里不需要甚至不希望使用ML。（遗憾的是，要求使用"...仅使用这些文件"似乎排除了这个选项。
其次，可以想到一些模式或启发式方法来生成所需的分类器（暂定为一个相对较弱的分类器，因为目前想到的模式/启发式方法似乎相对不可靠）。此外，这种方法在通常的理解中也不完全是ML方法。

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复