计算机工程与应用

2021, v.57;No.989(22) 42-52

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

不平衡数据集分类方法综述
Review of Classification Methods for Unbalanced Data Sets

王乐;韩萌;李小娟;张妮;程浩东;

摘要(Abstract):

不平衡数据集的特点导致了在分类时产生了诸多难题。对不平衡数据集的分类方法进行了分析与总结。在数据采样方法中从欠采样、过采样和混合采样三方面介绍不平衡数据集的分类方法;在欠采样方法中分为基于K近邻、Bagging和Boosting三种方法 ;在过采样方法中从合成少数过采样技术(Synthetic Minority Over-sampling Technology,SMOTE)、支持向量机(Support Vector Machine,SVM)两个角度来分析不平衡数据集的分类方法;对这两类采样方法的优缺点进行了比较,在相同数据集下比较算法的性能并进行分析与总结。从深度学习、极限学习机、代价敏感和特征选择四方面对不平衡数据集的分类方法进行了归纳。最后对下一步工作方向进行了展望。

关键词(KeyWords): 不平衡数据集;分类;采样方法;K近邻(KNN);合成少数过采样技术(SMOTE);深度学习

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金(62062004);; 宁夏自然科学基金(2020AAC03216);; 北方民族大学研究生创新项目(YCX20082)

作者(Author): 王乐;韩萌;李小娟;张妮;程浩东;

Email:

DOI:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享