计算机工程与应用

2022, v.58;No.992(01) 106-112

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

自适应插值与特征压缩的小样本数据分类研究
Adaptive Interpolation and Feature Compression for Small Sample Data Classification Study

孙永明;杨进;

摘要(Abstract):

大数据的类别不平衡与维度爆炸问题严重影响着算法的预测效率和分类精度。因此,提出了一种基于插值与特征压缩的大数据分类方法 ASE-RFXT。改进ADASYN(adaptive synthetic sampling approach)的插值中心,减少了噪声的引入,改善了少数类样本的分布。改进ReliefF(特征权重法),并将它与集成算法XGDT(extreme gradient dart tree)结合对特征进行并行加权,减少了权重受异常值的影响,使得评估更加准确。利用特征之间的相关性过滤低权重冗余特征,以XGDT的分类精度为评价指标通过SFS(sequential forward selection)压缩特征。实验结果表明ASE-RFXT方法可以降低特征维度,节约训练时间,提高不平衡小样本数据的分类精度。

关键词(KeyWords): 极限梯度提升;特征选择;自适应采样;特征加权

Abstract:

Keywords:

基金项目(Foundation): 国家教育部人文社科规划基金(16YJA630037);; 上海市一流学科建设项目(S1201YLXK)

作者(Author): 孙永明;杨进;

Email:

DOI:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享