逻辑回归和词袋模型

据我所知，X1代表某个词的出现次数，而beta1则是该词的权重。我的问题是关于权重是如何计算的？基于什么标准？

回答：

这个问题有点难，因为我不清楚你具体想做什么。但一般来说，你有数据提供X值和一个结果。结果应该是伯努利分布的，意味着只有两种可能的结果。现在你要从X值计算出一个概率。例如，你想知道一段文本是否与@某人有关。如果文本中出现“@某人”这个词，那么x1的值为1。X还可以描述“@某人”在文本中出现的频率。你尝试选择一个beta，使得beta1*x1的Sigmoid函数返回正确的概率，表明文本确实与@某人有关。如果文本中出现了“@某人”这个词。通常会使用一些机器学习算法来计算beta，比如梯度下降法。我简化了一些内容以便理解。我认为这个解释得相当好。最终，你会从数据中得到一个模型，可以在只有X值的新数据上预测结果。

学技术

逻辑回归和词袋模型

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复