使用MATLAB中的朴素贝叶斯分类器进行互联网流量分类

我在机器学习课程中进行了一个关于互联网流量分类的项目。我已经从http://wand.net.nz/wits/下载了跟踪文件(pcap格式)。现在,我想对同一数据集进行监督分类,并将流量分类为FTP、邮件、HTTP等。

我希望在Matlab中进行所有这些流量分类,并使用朴素贝叶斯分类器。现在我遇到了问题——我应该如何在Matlab中处理这个pcap文件,并在训练阶段获取类变量(如FTP、邮件、HTTP)。

面临的问题:

  1. 无法将这个pcap文件转换为人类可读的格式,如CSV。
  2. 我在Wireshark中打开了pcap文件,并且能够识别出跟踪,但是我应该如何保存它,以便Matlab可以处理它。

任何帮助将不胜感激。


回答:

看起来你需要将数据预处理成模型可以更好处理的格式。

我之前使用过一个名为Pcap.Net的C#库。这可以让你读取离线的PCAP文件,然后获取并处理你需要的数据以用于你的Matlab模型。

关于读取离线PCAP文件的教程可以在这里找到。从那里,你可以获取你需要的数据包段,并根据你设计的模型进行格式化。

希望这对你有帮助!

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注