我在机器学习课程中进行了一个关于互联网流量分类的项目。我已经从http://wand.net.nz/wits/下载了跟踪文件(pcap格式)。现在,我想对同一数据集进行监督分类,并将流量分类为FTP、邮件、HTTP等。
我希望在Matlab中进行所有这些流量分类,并使用朴素贝叶斯分类器。现在我遇到了问题——我应该如何在Matlab中处理这个pcap文件,并在训练阶段获取类变量(如FTP、邮件、HTTP)。
面临的问题:
- 无法将这个pcap文件转换为人类可读的格式,如CSV。
- 我在Wireshark中打开了pcap文件,并且能够识别出跟踪,但是我应该如何保存它,以便Matlab可以处理它。
任何帮助将不胜感激。
回答:
看起来你需要将数据预处理成模型可以更好处理的格式。
我之前使用过一个名为Pcap.Net的C#库。这可以让你读取离线的PCAP文件,然后获取并处理你需要的数据以用于你的Matlab模型。
关于读取离线PCAP文件的教程可以在这里找到。从那里,你可以获取你需要的数据包段,并根据你设计的模型进行格式化。
希望这对你有帮助!