他们通过结合CNN和RNN构建了一个CRNN网络,用于区分电视上的足球比赛和广告的视频分类器。
我的问题是分类或者简单地判断输入的视频是否包含作弊行为(考试作弊),根据这个教程,我应该用一组作弊和非作弊的图像来训练CNN,然后将一系列帧通过这个网络输出一个(作弊者/非作弊者)标志序列,最后用这个输出训练或测试RNN。
所以,CNN在这种情况下能否表现良好,因为我会和我的团队成员扮演作弊者和非作弊者来获取大量数据集来训练CNN,这意味着同一个人会扮演作弊者和非作弊者,这可能会导致混淆!
我的最后一个问题是,我可以使用教程中声明的方法来进行行为分类吗?或者CNN能成功地区分作弊和非作弊的帧吗?
回答:
实际上,使用同一个人来扮演作弊者和非作弊者的片段会改善训练。神经网络将不得不通过行为来学习区分,而不是作弊者的物理特征。
我预计这对你来说会运作得相当好。然而,根据特定行为的不同,你可能需要使用视频序列,而不是单个帧,来描述某些行为。有时候,作弊包括一系列的请求和回应,而不是单一帧内的数据。
这有帮助吗?