游戏社区的社区标准众包？

我运营几个Source游戏服务器，并运行一个将玩家聊天记录导出到MySQL数据库的插件。我已经积累了相当多的聊天历史记录，想找一些有趣的用途。我希望构建一个系统，让社区成员能够决定什么是‘可接受的’，什么不是‘可接受的’。

我的想法是这样的：以某种方式，让我的社区成员查看聊天记录（不显示是谁说的），并将这些记录标记为‘可接受’或‘不可接受’。我需要考虑是显示一段时间内的文本块，还是特定时间段内特定用户的聊天记录，还是单独的每一行（这可能不错，但也可能导致用户完全错过聊天的上下文）。

这有点像验证码系统，多个用户会对同一系列聊天记录进行评分。从中，我可以得到一组词语的评分。理论上，这将建立一个阈值，某些事情是可接受的，而其他事情则不可接受。在现有记录被评分到一定数量后，我将有一个有意义的方法来判断一条消息是否符合社区定义的标准。

我的问题是 –

你建议我向评分日志的用户展示什么？我应该展示X条聊天记录吗？还是应该展示5分钟内的所有聊天记录？还是应该缩小这两个窗口，只显示某个用户在这些时间段内的X条消息？或者用户应该单独评分每条记录？我计划限制每个社区成员每天可以评分的行数/组数。
设计存储所有这些数据的数据库的适当方式是什么？目前，每条聊天记录都作为MySQL中的一行存储。每条记录都有一个唯一ID以及游戏中发送的聊天消息的完整文本。我还有玩家名称和接收服务器的信息，但我认为这些不是必需的。
我想以一种方式创建这个系统，使其能够自我维持/适应社区及其认为可接受的内容。随着时间的推移，更多的记录将被评分并添加到阈值/计算中，以确定一条消息是‘好’还是‘坏’。如果有人构建过类似的东西，你能指出我在构建过程中应该避免的陷阱吗？

回答：

如果可能的话，我更倾向于让用户能够实时标记消息为不当。普通用户可以这样做，而不是你必须找到人来离线审查。如果你不能或不想采用这种方法：消息可能在没有其他消息上下文的情况下被识别为不当，但查看连续的消息流，按照它们实时出现的顺序，可能会有所帮助。我可能会选择给他们X条连续的消息。对于实时标记，我建议显示标记消息前后的几条消息，并将标记的消息标为红色，或类似的方式。

你可以尝试为用户审查一定数量的消息设立某种奖励系统。如果你允许实时标记消息，你可以奖励那些审查标记消息以确认标记状态的用户。

知道是哪个玩家可能会有用。如果一个玩家发布了几条不当消息，你可以发出警告或禁令之类。服务器信息可能不太有用，但我完全支持存储一些额外的信息，你以后可能会用到这些信息。

我不会太在意数据库存储。有一个包含时间（或简单的自动递增ID，或两者都有）、玩家、服务器、消息、isInappropriate的表应该没问题，这取决于你想执行什么类型的操作。

你可以采取的一种方法（一旦你有一些消息被标记为不当）将与垃圾邮件过滤器非常相似（你应该能找到足够多的相关资料）。

一般考虑的是，在标记为不当时，你是希望宽松还是严格（你希望错过一些不当消息还是标记一些实际上没问题的消息）。查看精确度/召回率可以给你一些关于这方面的想法。

我怀疑，在聊天环境中，通常可能只需查找（并可能尝试自动识别）出现在不当消息中的特定词语就足够了。

学技术

游戏社区的社区标准众包？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复