如何从网页上确定游戏类型?

如何通过解析网页来确定一个游戏是“街机”还是“体育”或“策略”类型的?我指的是那些托管在网页上的小型Flash游戏。

例如,请查看这些网页:http://www.miniclip.com/games/ski-safari/en/http://www.2dplay.com/the-last-dino/the-last-dino-play.htm

是否存在可以进行某种“分类”的服务?是否有现成的NLP算法可以帮助分类?


回答:

你可以从网页中提取相关文本,并使用词袋模型进行分类。最简单的情况下,你只需定义游戏类别并为每个类别列出关键词。页面上某个类别的关键词越多,游戏属于该类别的可能性就越大。

对于更复杂的方法,可以查看分类算法(例如,朴素贝叶斯)和文本特定特征(例如,tf-idf)。

另外要注意,从页面中提取相关文本在这里很重要。例如,如果页面只包含关于这个特定游戏的几个词和一系列相关新闻(描述其他游戏),那么相关新闻的片段可能会大大降低你的准确性。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注