KDDCup99是根据麻省理工学院林肯实验室的网络攻击模拟实验创建的数据集,用于帮助构建用于入侵检测的机器学习分类器。
而NSL-KDD是作为KDDCup99的清理版本创建的,删除了KDD99中的重复数据,并重建了训练和测试数据。
但是这两个数据集因缺乏现代攻击类型、训练集和测试集分布不平衡以及缺乏对一些常见网络协议的支持而受到批评,认为它们不符合当今的网络安全要求。
针对KDDCup和NSL-KDD的缺点,Moustafa和Slay创建了一个更复杂的入侵检测数据集,名为UNSW-NB15,以反映更好的现代攻击和协议。
UNSW-NB15是澳大利亚网络安全中心(ACCS)的研究人员,使用IXIA工具从100GB正常和现代攻击流量中提取的数据集。
完整的UNSW-NB15数据集包含250万条数据记录,涵盖1个正常类别和9个攻击类别,分别是分析、后门、DoS、漏洞利用、模糊器、通用、侦察、Shellcode和蠕虫。
原始数据由49个特征组成,可分为六组:流特征、基本特征、内容特征、时间特征、附加生成特征和标记特征。
这个数据集的创建者还提供了一个10%分区的数据集,分为训练集(175,341条记录)和测试集(82,332条记录)。