许多聊天频道(例如Omegle、mIRC)在与陌生人互动时会产生以下对话。
M
asl?
F 25
wonna sexchat?
这种行为非常普遍。检测视频或图像中的裸露是一个开放的研究问题。我在这里列出的应该更容易实现。有没有现成的解决方案?任何语言和任何开放且免费的库都可以(包括如何做的论文)!
回答:
有一个名为profanity
的Python
库。链接:profanity-check使用机器学习算法,我非常确定我们可以轻松处理这个问题。为此,您应该收集完整的词汇。收集后,您可以添加一个标签行,例如如果可以接受则为0,如果不可接受则为1。然后,使用一些成功的机器学习算法,您可以将数据与euclidian
、manhattan
类型的距离标准相关联,并创建一个关于内容是否不良的决策机制。很难预测成功率会是多少,但我认为通过这种方法,可以达到接近90%的成功率。我想与您分享一位我在这个领域信任的学者。Yılmaz Kaya