计算机工程与应用

2020, v.56;No.965(22) 160-165

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于约简属性和阈值分割的决策树构建方法
Decision Tree Construction Method Based on Reduction Attribute and Threshold Segmentation

谭正华;戴立平;文阳;李国泰;

摘要(Abstract):

针对决策树C4.5算法在处理连续值属性过程中时间复杂度较高的问题,提出一种新的决策树构建方法:采用概率论中属性间的相关系数(Pearson),对数据集中的属性进行约简;结合属性的信息增益率,保留决策属性的最优子集,保证属性子集中没有冗余属性;采用边界点的判定,改进了连续值属性离散化过程中阈值分割方法,对信息增益率的计算进行修正。采用UCI数据库中的数据集,在Pycharm平台上进行一系列对比实验,结果表明:采用改进后C4.5决策树算法,决策树生成效率提高了约50%,准确率提升约2%,比较有效地解决了原C4.5算法属性选择偏连续值属性的问题。

关键词(KeyWords): 决策树;冗余属性;边界点;阈值分割;信息增益率

Abstract:

Keywords:

基金项目(Foundation):

作者(Author): 谭正华;戴立平;文阳;李国泰;

Email:

DOI:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享