游戏社区的社区标准众包?

我运营几个Source游戏服务器,并运行一个将玩家聊天记录导出到MySQL数据库的插件。我已经积累了相当多的聊天历史记录,想找一些有趣的用途。我希望构建一个系统,让社区成员能够决定什么是‘可接受的’,什么不是‘可接受的’。

我的想法是这样的:以某种方式,让我的社区成员查看聊天记录(不显示是谁说的),并将这些记录标记为‘可接受’或‘不可接受’。我需要考虑是显示一段时间内的文本块,还是特定时间段内特定用户的聊天记录,还是单独的每一行(这可能不错,但也可能导致用户完全错过聊天的上下文)。

这有点像验证码系统,多个用户会对同一系列聊天记录进行评分。从中,我可以得到一组词语的评分。理论上,这将建立一个阈值,某些事情是可接受的,而其他事情则不可接受。在现有记录被评分到一定数量后,我将有一个有意义的方法来判断一条消息是否符合社区定义的标准。

我的问题是 –

  1. 你建议我向评分日志的用户展示什么?我应该展示X条聊天记录吗?还是应该展示5分钟内的所有聊天记录?还是应该缩小这两个窗口,只显示某个用户在这些时间段内的X条消息?或者用户应该单独评分每条记录?我计划限制每个社区成员每天可以评分的行数/组数。
  2. 设计存储所有这些数据的数据库的适当方式是什么?目前,每条聊天记录都作为MySQL中的一行存储。每条记录都有一个唯一ID以及游戏中发送的聊天消息的完整文本。我还有玩家名称和接收服务器的信息,但我认为这些不是必需的。
  3. 我想以一种方式创建这个系统,使其能够自我维持/适应社区及其认为可接受的内容。随着时间的推移,更多的记录将被评分并添加到阈值/计算中,以确定一条消息是‘好’还是‘坏’。如果有人构建过类似的东西,你能指出我在构建过程中应该避免的陷阱吗?

回答:

如果可能的话,我更倾向于让用户能够实时标记消息为不当。普通用户可以这样做,而不是你必须找到人来离线审查。如果你不能或不想采用这种方法:消息可能在没有其他消息上下文的情况下被识别为不当,但查看连续的消息流,按照它们实时出现的顺序,可能会有所帮助。我可能会选择给他们X条连续的消息。对于实时标记,我建议显示标记消息前后的几条消息,并将标记的消息标为红色,或类似的方式。

你可以尝试为用户审查一定数量的消息设立某种奖励系统。如果你允许实时标记消息,你可以奖励那些审查标记消息以确认标记状态的用户。

知道是哪个玩家可能会有用。如果一个玩家发布了几条不当消息,你可以发出警告或禁令之类。服务器信息可能不太有用,但我完全支持存储一些额外的信息,你以后可能会用到这些信息。

我不会太在意数据库存储。有一个包含时间(或简单的自动递增ID,或两者都有)、玩家、服务器、消息、isInappropriate的表应该没问题,这取决于你想执行什么类型的操作。

你可以采取的一种方法(一旦你有一些消息被标记为不当)将与垃圾邮件过滤器非常相似(你应该能找到足够多的相关资料)。

一般考虑的是,在标记为不当时,你是希望宽松还是严格(你希望错过一些不当消息还是标记一些实际上没问题的消息)。查看精确度/召回率可以给你一些关于这方面的想法。

我怀疑,在聊天环境中,通常可能只需查找(并可能尝试自动识别)出现在不当消息中的特定词语就足够了。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注