从而可以用来减少RFE的搜索空间,也不需要从所有特征开始,但在递归特征消除之前,必须初始化变量。
为了表示初始特征的数量,它决定了最坏情况下RFE的迭代次数,这用于记录RFE期间的最佳性能,存储RFE每次迭代后选择的特征,存储最佳性能的特征子集。
在递归特征消除的过程中,每次迭代开始时都会初始化一个空字典Performance,这将会用于存储消除每个特征后MLP的验证性能。
而在评估消除函数中,通过对10个不同实验(每个实验设置不同的随机种子)的准确度进行平均来计算分数。
在这之后,患者p决定是否继续RFE,如果患者p大于0,则执行一次RFE迭代,并获得该迭代的局部最佳性能。
再比较局部最佳性能和全局最佳性能后,更新全局最佳性能和选定的特征,这也是为了入侵系统的检测。
UNSW-NB15数据集对于机器学习方法的入侵检测系统,数据集在抵御未知攻击的有效性、测试性能和通用性方面发挥着至关重要的作用。
而IDS数据集,需要包含足够数量的不同类型的攻击并反映真实的攻击场景,其中一个著名的IDS数据集是KDDCup99,它在之前的许多研究中得到了广泛的应用。