使用神经网络预测基于字符串条件的结果

我目前正在进行一个项目,需要使用某种神经网络基于字符串数据进行预测,问题在于字符串数据并不是神经网络可以直接处理的,因此我研究了将字符串索引为数值的方法。大多数方法使用单词和单词列表,比如词袋模型的概念,但这并不适用于我的问题,因为我处理的是包含符号、字母和数字的日志数据,这些数据并不形成单词或类似的东西。

有没有一种算法可以很好地处理数字,或者有没有一种有效的方法将字符串表示为数值形式?


回答:

最终,我通过编写一个词到向量的特征提取程序解决了这个问题。这种程序根据前面的常见词、字母数量和出现频率等标准,将单词转换为多维向量系统。这使得单词的数值表示能够保留意义和上下文,并且程序可以处理之前从未见过的单词。市面上有许多开源的Word2Vec程序,如果你在谷歌上搜索这个名字,任何人都可以找到足够的资源来创建一个,如果他们有和我类似的问题的话。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注