- 康梦轩;宋俊平;范鹏飞;高博文;周旭;李琢;
精准地预判网络流量变化趋势可以帮助运营商准确预估网络的使用情况,合理分配并高效利用网络资源,以满足日益增长且多样化的用户需求。以深度学习算法在网络流量预测领域的进展为线索,阐述了网络流量预测的评价指标和目前公开的网络流量数据集及应用,具体分析了网络流量预测中常用的深度信念网络、卷积神经网络、循环神经网络和长短时记忆网络共四种深度学习方法,并重点介绍了近年来针对不同问题所提出的改进神经网络模型,总结了各模型特点及应用场景。最后对网络流量预测未来发展进行了展望。
2021年10期 v.57;No.977 1-9页 [查看摘要][在线阅读][下载 1519K] [下载次数:2074 ] |[网刊下载次数:0 ] |[引用频次:49 ] |[阅读次数:0 ] - 康梦轩;宋俊平;范鹏飞;高博文;周旭;李琢;
精准地预判网络流量变化趋势可以帮助运营商准确预估网络的使用情况,合理分配并高效利用网络资源,以满足日益增长且多样化的用户需求。以深度学习算法在网络流量预测领域的进展为线索,阐述了网络流量预测的评价指标和目前公开的网络流量数据集及应用,具体分析了网络流量预测中常用的深度信念网络、卷积神经网络、循环神经网络和长短时记忆网络共四种深度学习方法,并重点介绍了近年来针对不同问题所提出的改进神经网络模型,总结了各模型特点及应用场景。最后对网络流量预测未来发展进行了展望。
2021年10期 v.57;No.977 1-9页 [查看摘要][在线阅读][下载 1519K] [下载次数:2074 ] |[网刊下载次数:0 ] |[引用频次:49 ] |[阅读次数:0 ] - 麻琛彬;张政波;王晶;
生理信号通常涵盖机体的生物电活动、温度、压力等关键信息,监测其数值波动有助于预警临床事件风险。深度模型是包含多级非线性变换的层级机器学习模型,在特征提取与建模方面优势显著,在计算机辅助诊断领域有着巨大的应用前景。随着连续生理参数监测技术的进步,深度模型在生理电信号异常检测中的效用逐渐提高,研究重点也向临床应用领域拓展。报告了深度模型在生理电信号异常检测中的研究进展。从临床应用出发,分析了经典信号异常检测方法的优势与不足,简述了当前深度模型的建模方式。从判别模型和生成模型的角度总结了经典模型的建模原理及最新应用,同时讨论了深度模型的训练架构和训练策略。结合异常检测在临床中的应用、深度模型的研究进展以及生理数据集的可用性三方面进行总结与讨论,并对未来研究进行展望。
2021年10期 v.57;No.977 10-25页 [查看摘要][在线阅读][下载 2363K] [下载次数:733 ] |[网刊下载次数:0 ] |[引用频次:10 ] |[阅读次数:0 ] - 麻琛彬;张政波;王晶;
生理信号通常涵盖机体的生物电活动、温度、压力等关键信息,监测其数值波动有助于预警临床事件风险。深度模型是包含多级非线性变换的层级机器学习模型,在特征提取与建模方面优势显著,在计算机辅助诊断领域有着巨大的应用前景。随着连续生理参数监测技术的进步,深度模型在生理电信号异常检测中的效用逐渐提高,研究重点也向临床应用领域拓展。报告了深度模型在生理电信号异常检测中的研究进展。从临床应用出发,分析了经典信号异常检测方法的优势与不足,简述了当前深度模型的建模方式。从判别模型和生成模型的角度总结了经典模型的建模原理及最新应用,同时讨论了深度模型的训练架构和训练策略。结合异常检测在临床中的应用、深度模型的研究进展以及生理数据集的可用性三方面进行总结与讨论,并对未来研究进行展望。
2021年10期 v.57;No.977 10-25页 [查看摘要][在线阅读][下载 2363K] [下载次数:733 ] |[网刊下载次数:0 ] |[引用频次:10 ] |[阅读次数:0 ] - 王发明;李建微;陈思喜;
三维人体姿态估计在本质上是一个分类问题和回归问题,主要通过图像估计人体的三维姿态。基于传统方法和深度学习方法的三维人体姿态估计是当前研究的主流方法。按照传统方法到深度学习方法的顺序对近年来三维人体姿态估计方法进行系统介绍,从而了解传统方法通过生成和判别等方法得到人体姿态的众多要素完成三维人体姿态的估计。基于深度学习的三维人体姿态估计方法主要通过构建神经网络,从图像特征中回归出人体姿态信息,大致可以分为基于直接回归方法、基于2D信息方法和基于混合方法的三维人体姿态估计这三类。最后对当前三维人体姿态估计研究所面临的困难与挑战进行阐述,并对未来的研究趋势做出展望。
2021年10期 v.57;No.977 26-38页 [查看摘要][在线阅读][下载 1923K] [下载次数:2467 ] |[网刊下载次数:0 ] |[引用频次:35 ] |[阅读次数:0 ] - 王发明;李建微;陈思喜;
三维人体姿态估计在本质上是一个分类问题和回归问题,主要通过图像估计人体的三维姿态。基于传统方法和深度学习方法的三维人体姿态估计是当前研究的主流方法。按照传统方法到深度学习方法的顺序对近年来三维人体姿态估计方法进行系统介绍,从而了解传统方法通过生成和判别等方法得到人体姿态的众多要素完成三维人体姿态的估计。基于深度学习的三维人体姿态估计方法主要通过构建神经网络,从图像特征中回归出人体姿态信息,大致可以分为基于直接回归方法、基于2D信息方法和基于混合方法的三维人体姿态估计这三类。最后对当前三维人体姿态估计研究所面临的困难与挑战进行阐述,并对未来的研究趋势做出展望。
2021年10期 v.57;No.977 26-38页 [查看摘要][在线阅读][下载 1923K] [下载次数:2467 ] |[网刊下载次数:0 ] |[引用频次:35 ] |[阅读次数:0 ] - 温庭栋;宋文爱;赵莉;孙雪;杨吉江;王青;雷毅;
胃癌是全世界癌症死亡的第三大主要原因,胃癌的早期检测会对胃癌患者的后期治疗起到至关重要的作用。随着人工智能的发展,可以利用计算机视觉领域的机器学习模型辅助检测早期胃癌,有研究发现一些计算机辅助诊断模型的筛查率接近甚至高于医生。利用计算机辅助诊断可以及早发现胃癌以减少胃癌患者的后期治疗成本。报告了基于机器学习在胃镜下早期胃癌辅助诊断的研究现状,介绍了胃镜下早期胃癌的临床诊断方式,并基于此提出了计算机辅助诊断该疾病的技术路线,分析了不同诊断技术路线的研究特点,为计算机辅助诊断早期胃癌提供不同的切入点。总结了用于早期胃癌检测的机器学习、深度学习、目标检测模型,讨论了其应用于计算机辅助诊断的问题及挑战。
2021年10期 v.57;No.977 39-47页 [查看摘要][在线阅读][下载 1409K] [下载次数:767 ] |[网刊下载次数:0 ] |[引用频次:7 ] |[阅读次数:0 ] - 温庭栋;宋文爱;赵莉;孙雪;杨吉江;王青;雷毅;
胃癌是全世界癌症死亡的第三大主要原因,胃癌的早期检测会对胃癌患者的后期治疗起到至关重要的作用。随着人工智能的发展,可以利用计算机视觉领域的机器学习模型辅助检测早期胃癌,有研究发现一些计算机辅助诊断模型的筛查率接近甚至高于医生。利用计算机辅助诊断可以及早发现胃癌以减少胃癌患者的后期治疗成本。报告了基于机器学习在胃镜下早期胃癌辅助诊断的研究现状,介绍了胃镜下早期胃癌的临床诊断方式,并基于此提出了计算机辅助诊断该疾病的技术路线,分析了不同诊断技术路线的研究特点,为计算机辅助诊断早期胃癌提供不同的切入点。总结了用于早期胃癌检测的机器学习、深度学习、目标检测模型,讨论了其应用于计算机辅助诊断的问题及挑战。
2021年10期 v.57;No.977 39-47页 [查看摘要][在线阅读][下载 1409K] [下载次数:767 ] |[网刊下载次数:0 ] |[引用频次:7 ] |[阅读次数:0 ] - 郝超;裘杭萍;孙毅;张超然;
文本分类作为自然语言处理中一个基本任务,在20世纪50年代就已经对其算法进行了研究,现在单标签文本分类算法已经趋向成熟,但是对于多标签文本分类的研究还有很大的提升空间。介绍了多标签文本分类的基本概念以及基本流程,包括数据集获取、文本预处理、模型训练和预测结果。介绍了多标签文本分类的方法。这些方法主要分为两大类:传统机器学习方法和基于深度学习的方法。传统机器学习方法主要包括问题转换方法和算法自适应方法。基于深度学习的方法是利用各种神经网络模型来处理多标签文本分类问题,根据模型结构,将其分为基于CNN结构、基于RNN结构和基于Transformer结构的多标签文本分类方法。对多标签文本分类常用的数据集进行了梳理总结。对未来的发展趋势进行了分析与展望。
2021年10期 v.57;No.977 48-56页 [查看摘要][在线阅读][下载 1415K] [下载次数:1987 ] |[网刊下载次数:0 ] |[引用频次:52 ] |[阅读次数:0 ] - 郝超;裘杭萍;孙毅;张超然;
文本分类作为自然语言处理中一个基本任务,在20世纪50年代就已经对其算法进行了研究,现在单标签文本分类算法已经趋向成熟,但是对于多标签文本分类的研究还有很大的提升空间。介绍了多标签文本分类的基本概念以及基本流程,包括数据集获取、文本预处理、模型训练和预测结果。介绍了多标签文本分类的方法。这些方法主要分为两大类:传统机器学习方法和基于深度学习的方法。传统机器学习方法主要包括问题转换方法和算法自适应方法。基于深度学习的方法是利用各种神经网络模型来处理多标签文本分类问题,根据模型结构,将其分为基于CNN结构、基于RNN结构和基于Transformer结构的多标签文本分类方法。对多标签文本分类常用的数据集进行了梳理总结。对未来的发展趋势进行了分析与展望。
2021年10期 v.57;No.977 48-56页 [查看摘要][在线阅读][下载 1415K] [下载次数:1987 ] |[网刊下载次数:0 ] |[引用频次:52 ] |[阅读次数:0 ] - 曾黎;徐慧颖;陈晓昊;钱晓亮;
高分遥感图像场景分类致力于自动辨别土地利用或覆盖的类别,在军事和国土资源勘探等领域具有重要的应用价值。基于深度学习的高分遥感图像场景分类方法取得了比传统方法更好的效果,也是当前研究的热点,对此类方法进行归纳总结和综合评估。按照监督方式的不同,对基于深度学习的流行方法进行了逐类分析。对不同监督方式下的流行方法在三个公开数据集上进行了定量实验评估。总结了基于不同监督方式方法的特点,并对下一步发展趋势进行了展望。
2021年10期 v.57;No.977 57-64页 [查看摘要][在线阅读][下载 1353K] [下载次数:1110 ] |[网刊下载次数:0 ] |[引用频次:14 ] |[阅读次数:0 ] - 曾黎;徐慧颖;陈晓昊;钱晓亮;
高分遥感图像场景分类致力于自动辨别土地利用或覆盖的类别,在军事和国土资源勘探等领域具有重要的应用价值。基于深度学习的高分遥感图像场景分类方法取得了比传统方法更好的效果,也是当前研究的热点,对此类方法进行归纳总结和综合评估。按照监督方式的不同,对基于深度学习的流行方法进行了逐类分析。对不同监督方式下的流行方法在三个公开数据集上进行了定量实验评估。总结了基于不同监督方式方法的特点,并对下一步发展趋势进行了展望。
2021年10期 v.57;No.977 57-64页 [查看摘要][在线阅读][下载 1353K] [下载次数:1110 ] |[网刊下载次数:0 ] |[引用频次:14 ] |[阅读次数:0 ]
- 孙凌浩;
随着深度学习技术的应用,自然语言处理领域得到快速发展,为提高中文命名实体识别效果,提出一种新的方法,利用英文模型抽取信息辅助中文命名实体识别。该方法使用翻译模型将中文翻译为英文,然后利用英文命名实体识别模型抽取特征,再利用翻译模型的注意力权重进行信息迁移,将预训练的英文命名实体识别模型提取的特征用于中文命名实体识别。该方法可以将训练模型中得到的任务相关特征进行迁移,从而丰富原始数据的语义表示。在两个中文命名实体识别数据集上的实验表明,该方法优于其他现有方法。
2021年10期 v.57;No.977 94-100页 [查看摘要][在线阅读][下载 1718K] [下载次数:471 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ] - 孙凌浩;
随着深度学习技术的应用,自然语言处理领域得到快速发展,为提高中文命名实体识别效果,提出一种新的方法,利用英文模型抽取信息辅助中文命名实体识别。该方法使用翻译模型将中文翻译为英文,然后利用英文命名实体识别模型抽取特征,再利用翻译模型的注意力权重进行信息迁移,将预训练的英文命名实体识别模型提取的特征用于中文命名实体识别。该方法可以将训练模型中得到的任务相关特征进行迁移,从而丰富原始数据的语义表示。在两个中文命名实体识别数据集上的实验表明,该方法优于其他现有方法。
2021年10期 v.57;No.977 94-100页 [查看摘要][在线阅读][下载 1718K] [下载次数:471 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ] - 刘云;钱美伊;李辉;王传旭;
基于孪生网络的目标跟踪,存在特征信息欠丰富,跟踪效率有待提高,大型数据集上训练时间长等问题。针对上述问题,提出特征融合与训练加速的高效目标跟踪。增加主干网络参考特征层级,减小下采样,融合多层级参考特征图,提取目标更深度、丰富的语义信息。深度互相关操作得到候选窗口响应(Response of Candidate Windows,RoWs),在其中构建区域建议网络(Region Proposal Network,RPN),通过权衡正负锚点的数量比,使孪生网络性能更加高效、稳定。大型数据集训练孪生网络时,使用均匀滑动漂移采样,代替随机漂移采样算法,在抑制中心偏置现象的同时,显著加快了孪生网络的训练速度。跟踪基准VOT2018上的评估实验结果表明,与所有参考的主流目标跟踪算法相比,所提算法具有最佳的跟踪性能。
2021年10期 v.57;No.977 101-109页 [查看摘要][在线阅读][下载 3259K] [下载次数:235 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ] - 刘云;钱美伊;李辉;王传旭;
基于孪生网络的目标跟踪,存在特征信息欠丰富,跟踪效率有待提高,大型数据集上训练时间长等问题。针对上述问题,提出特征融合与训练加速的高效目标跟踪。增加主干网络参考特征层级,减小下采样,融合多层级参考特征图,提取目标更深度、丰富的语义信息。深度互相关操作得到候选窗口响应(Response of Candidate Windows,RoWs),在其中构建区域建议网络(Region Proposal Network,RPN),通过权衡正负锚点的数量比,使孪生网络性能更加高效、稳定。大型数据集训练孪生网络时,使用均匀滑动漂移采样,代替随机漂移采样算法,在抑制中心偏置现象的同时,显著加快了孪生网络的训练速度。跟踪基准VOT2018上的评估实验结果表明,与所有参考的主流目标跟踪算法相比,所提算法具有最佳的跟踪性能。
2021年10期 v.57;No.977 101-109页 [查看摘要][在线阅读][下载 3259K] [下载次数:235 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ] - 李博;
跨镜行人追踪是计算机视觉和视频监控公共安全体系构建等领域的重要课题。伴随大规模数据集的发展和深度学习网络的广泛研究,深度学习在跨镜行人追踪问题中取得了良好效果。然而在应用中,除了监控视频自身的不同摄像头、不同视角引起的不同视觉表象变化外,面向跨镜行人追踪的整体数据集偏小,具有标记的训练数据样本量更小,从而制约了基于深度学习的跨镜行人追踪效果。提出了改进型深度迁移学习的跨镜行人追踪算法,将在大数据集上训练好的成熟模型进行微调并迁移到目标数据集上,结合目标数据进行优化,使其能更好地针对新数据集做特征提取。在模型训练过程中,通过改进三元组损失函数,拉近相同样本之间的距离,加大不同样本之间的距离,同时设定正样本之间的最大距离阈值,从而保证特征空间生成的簇不会太大,利于模型的优化。该算法减少了深度学习训练模型的时间,避免了小数据集上数据量不足等缺点,提高了跨镜行人追踪的准确度。在五个基准数据集上的跨镜行人追踪对比实验显示,改进算法取得了良好效果。
2021年10期 v.57;No.977 110-116页 [查看摘要][在线阅读][下载 1475K] [下载次数:337 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ] - 李博;
跨镜行人追踪是计算机视觉和视频监控公共安全体系构建等领域的重要课题。伴随大规模数据集的发展和深度学习网络的广泛研究,深度学习在跨镜行人追踪问题中取得了良好效果。然而在应用中,除了监控视频自身的不同摄像头、不同视角引起的不同视觉表象变化外,面向跨镜行人追踪的整体数据集偏小,具有标记的训练数据样本量更小,从而制约了基于深度学习的跨镜行人追踪效果。提出了改进型深度迁移学习的跨镜行人追踪算法,将在大数据集上训练好的成熟模型进行微调并迁移到目标数据集上,结合目标数据进行优化,使其能更好地针对新数据集做特征提取。在模型训练过程中,通过改进三元组损失函数,拉近相同样本之间的距离,加大不同样本之间的距离,同时设定正样本之间的最大距离阈值,从而保证特征空间生成的簇不会太大,利于模型的优化。该算法减少了深度学习训练模型的时间,避免了小数据集上数据量不足等缺点,提高了跨镜行人追踪的准确度。在五个基准数据集上的跨镜行人追踪对比实验显示,改进算法取得了良好效果。
2021年10期 v.57;No.977 110-116页 [查看摘要][在线阅读][下载 1475K] [下载次数:337 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ] - 吴杰;段锦;董锁芹;李英超;
针对年龄变化对人脸识别率影响的问题,结合生成式对抗网络(Generative Adversarial Network,GAN)与深度特征迁移提出一种跨年龄人脸生成方法 DFM-GAN(Depth Feature Migration GAN),并进行跨年龄模拟人脸验证实验研究。首先通过卷积编码器将真实样本映射到特征向量,然后利用反卷积生成器将向量投影到独热编码年龄条件下的人脸集合,通过在特征空间中迁移数据库样本人脸纹理风格、语义特点等属性,模拟生成待检人员在不同年龄段的面部图像,减少与数据库样本之间的差异性。同时通过高斯边缘模糊的方法对样本数据集做预处理,引入边缘提升对抗损失函数,使生成图像具有更为清晰的边缘,对生成图像进行局部颜色直方图匹配,增加对比度,达到提高跨年龄人脸识别性能的目的。进行了单样本不同年龄实验与指定年龄多样本实验,以人脸相似度与人脸距两项指标进行实验测量,结果表明:跨年龄数据样本经过DFM-GAN生成后的人脸图像,相似度平均提高了19.24个百分点,人脸距离平均减少了0.451,在跨年龄人脸识别方向具有较好的可行性和一定的实际意义。
2021年10期 v.57;No.977 117-124页 [查看摘要][在线阅读][下载 3019K] [下载次数:400 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ] - 吴杰;段锦;董锁芹;李英超;
针对年龄变化对人脸识别率影响的问题,结合生成式对抗网络(Generative Adversarial Network,GAN)与深度特征迁移提出一种跨年龄人脸生成方法 DFM-GAN(Depth Feature Migration GAN),并进行跨年龄模拟人脸验证实验研究。首先通过卷积编码器将真实样本映射到特征向量,然后利用反卷积生成器将向量投影到独热编码年龄条件下的人脸集合,通过在特征空间中迁移数据库样本人脸纹理风格、语义特点等属性,模拟生成待检人员在不同年龄段的面部图像,减少与数据库样本之间的差异性。同时通过高斯边缘模糊的方法对样本数据集做预处理,引入边缘提升对抗损失函数,使生成图像具有更为清晰的边缘,对生成图像进行局部颜色直方图匹配,增加对比度,达到提高跨年龄人脸识别性能的目的。进行了单样本不同年龄实验与指定年龄多样本实验,以人脸相似度与人脸距两项指标进行实验测量,结果表明:跨年龄数据样本经过DFM-GAN生成后的人脸图像,相似度平均提高了19.24个百分点,人脸距离平均减少了0.451,在跨年龄人脸识别方向具有较好的可行性和一定的实际意义。
2021年10期 v.57;No.977 117-124页 [查看摘要][在线阅读][下载 3019K] [下载次数:400 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ] - 许春冬;辛鹏丽;周静;应冬文;
正常与异常心音分类在心血管疾病的筛查中有着重要的作用。建立在无心音分割的基础上,提出了一种基于功率谱密度时频分布特征与卷积神经网络的心音分类方法。该方法采用小波降噪做预处理,通过循环自相关获取心动周期,采用双线性插值法提取维度一致的心动周期功率谱密度时频特征,并送入卷积神经网络进行训练与测试。实验采用Challenge 2016数据集进行训练与测试,测试集的分类精度达到0.847 2,灵敏度和特异性评分达到0.776 3和0.946 3,整体性能良好。与其他算法的对比结果显示,该算法获得了更高的总体评分。
2021年10期 v.57;No.977 125-132页 [查看摘要][在线阅读][下载 2444K] [下载次数:626 ] |[网刊下载次数:0 ] |[引用频次:11 ] |[阅读次数:0 ] - 许春冬;辛鹏丽;周静;应冬文;
正常与异常心音分类在心血管疾病的筛查中有着重要的作用。建立在无心音分割的基础上,提出了一种基于功率谱密度时频分布特征与卷积神经网络的心音分类方法。该方法采用小波降噪做预处理,通过循环自相关获取心动周期,采用双线性插值法提取维度一致的心动周期功率谱密度时频特征,并送入卷积神经网络进行训练与测试。实验采用Challenge 2016数据集进行训练与测试,测试集的分类精度达到0.847 2,灵敏度和特异性评分达到0.776 3和0.946 3,整体性能良好。与其他算法的对比结果显示,该算法获得了更高的总体评分。
2021年10期 v.57;No.977 125-132页 [查看摘要][在线阅读][下载 2444K] [下载次数:626 ] |[网刊下载次数:0 ] |[引用频次:11 ] |[阅读次数:0 ] - 孙浩天;袁刚;杨杨;刘含秋;郑健;杨晓冬;张寅;
计算机断层扫描(Computer Tomography,CT)图像中肺结节的良恶性诊断对治疗方案的选择有非常重要的作用。目前基于深度学习的CT图像肺结节良恶性分类算法的一个研究趋势是充分利用CT图像的三维信息来设计网络,但由于不同CT设备采集的图像参数不同,不同样本的CT图像其层内及层间分辨率也多不相同,进行特征提取前需要进行额外的预处理工作。大多数文献的做法是采用插值的方法统一分辨率,然而这种方法会造成图像分辨率降低或计算量增加等问题。针对这一问题,提出了一种基于三维各向异性卷积的肺结节良恶性分类网络,通过将标准三维卷积拆分为k×k×1和1×1×k的两种三维各向异性卷积,避免了直接将三维卷积作用到原始CT图像上,从而避免了图像分辨率不同的影响。还提出了裁剪-非局部池化模块,通过中心裁剪和非局部池化操作,强化网络对结节区域的特征提取,同时使浅层网络也可以获取全局信息。在Lung Image Database Consortium and Image Database Resource Initiative(LIDC-IDRI)数据集上的实验表明,提出的三维各向异性卷积结合裁剪-非局部池化操作的神经网络能显著减少网络参数量,提升网络提取特征的能力,实现对肺结节良恶性的准确分类,分类的准确率、敏感性、特异性分别为91.53%、88.89%和93.27%,取得了比较好的分类性能。
2021年10期 v.57;No.977 133-138页 [查看摘要][在线阅读][下载 1816K] [下载次数:256 ] |[网刊下载次数:0 ] |[引用频次:7 ] |[阅读次数:0 ] - 孙浩天;袁刚;杨杨;刘含秋;郑健;杨晓冬;张寅;
计算机断层扫描(Computer Tomography,CT)图像中肺结节的良恶性诊断对治疗方案的选择有非常重要的作用。目前基于深度学习的CT图像肺结节良恶性分类算法的一个研究趋势是充分利用CT图像的三维信息来设计网络,但由于不同CT设备采集的图像参数不同,不同样本的CT图像其层内及层间分辨率也多不相同,进行特征提取前需要进行额外的预处理工作。大多数文献的做法是采用插值的方法统一分辨率,然而这种方法会造成图像分辨率降低或计算量增加等问题。针对这一问题,提出了一种基于三维各向异性卷积的肺结节良恶性分类网络,通过将标准三维卷积拆分为k×k×1和1×1×k的两种三维各向异性卷积,避免了直接将三维卷积作用到原始CT图像上,从而避免了图像分辨率不同的影响。还提出了裁剪-非局部池化模块,通过中心裁剪和非局部池化操作,强化网络对结节区域的特征提取,同时使浅层网络也可以获取全局信息。在Lung Image Database Consortium and Image Database Resource Initiative(LIDC-IDRI)数据集上的实验表明,提出的三维各向异性卷积结合裁剪-非局部池化操作的神经网络能显著减少网络参数量,提升网络提取特征的能力,实现对肺结节良恶性的准确分类,分类的准确率、敏感性、特异性分别为91.53%、88.89%和93.27%,取得了比较好的分类性能。
2021年10期 v.57;No.977 133-138页 [查看摘要][在线阅读][下载 1816K] [下载次数:256 ] |[网刊下载次数:0 ] |[引用频次:7 ] |[阅读次数:0 ] - 郑诚;王建;
面对数量庞大的用户和物品数量,推荐系统通常面临着数据稀疏的问题,为缓解此问题,提出了一个融合注意力机制和自编码器的协同过滤模型。该模型将评分信息送入一个基于自编码器的协同过滤子模型中以挖掘用户整体偏好,同时将评分信息送入一个融合了注意力机制的基于物品的协同过滤子模型中以挖掘物品与物品之间的局部依赖信息,随后将两个子模型的结果相融合,拟合出最终的结果。模型在MovieLens和Pinterest数据集上进行了实验验证,实验结果与基准相比有所改善。
2021年10期 v.57;No.977 139-145页 [查看摘要][在线阅读][下载 1760K] [下载次数:351 ] |[网刊下载次数:0 ] |[引用频次:16 ] |[阅读次数:0 ] - 郑诚;王建;
面对数量庞大的用户和物品数量,推荐系统通常面临着数据稀疏的问题,为缓解此问题,提出了一个融合注意力机制和自编码器的协同过滤模型。该模型将评分信息送入一个基于自编码器的协同过滤子模型中以挖掘用户整体偏好,同时将评分信息送入一个融合了注意力机制的基于物品的协同过滤子模型中以挖掘物品与物品之间的局部依赖信息,随后将两个子模型的结果相融合,拟合出最终的结果。模型在MovieLens和Pinterest数据集上进行了实验验证,实验结果与基准相比有所改善。
2021年10期 v.57;No.977 139-145页 [查看摘要][在线阅读][下载 1760K] [下载次数:351 ] |[网刊下载次数:0 ] |[引用频次:16 ] |[阅读次数:0 ] - 谢艺菲;卢琪;刘鑫;胡亚豪;潘志松;陈浩;
事实验证任务要求能够从大规模的文本语料库中抽取相关的证据,并通过推理对给定的声明得出事实性的判断。现有的研究通常将检索到的证据拼接,然后比较声明和证据嵌入的余弦相似度,这些方法忽视了长距离证据之间的联系,以及不同层次的语义相似度,而这些特征对于推理验证至关重要。设计了一种基于图的多层次注意力模型(Graph-aware Hierarchical Attention Networks for Fact Verification,GHAN)。该模型首先通过BERT(Bidirectional Encoder Representation from Transformers)筛选出所需的证据片段,再利用卷积神经网络提取不同长度的N-gram特征,构造不同粒度的相似度转移矩阵提取相似度特征。为了综合考虑字符级别和句子级别的语义信息,将证据信息构建成信息融合图,再利用基于核函数的注意力机制进行信息传递与证据推理。该算法在FEVER数据集上取得较好的效果,优于其他基于BERT的方法。
2021年10期 v.57;No.977 146-153页 [查看摘要][在线阅读][下载 1739K] [下载次数:185 ] |[网刊下载次数:0 ] |[引用频次:2 ] |[阅读次数:0 ] - 谢艺菲;卢琪;刘鑫;胡亚豪;潘志松;陈浩;
事实验证任务要求能够从大规模的文本语料库中抽取相关的证据,并通过推理对给定的声明得出事实性的判断。现有的研究通常将检索到的证据拼接,然后比较声明和证据嵌入的余弦相似度,这些方法忽视了长距离证据之间的联系,以及不同层次的语义相似度,而这些特征对于推理验证至关重要。设计了一种基于图的多层次注意力模型(Graph-aware Hierarchical Attention Networks for Fact Verification,GHAN)。该模型首先通过BERT(Bidirectional Encoder Representation from Transformers)筛选出所需的证据片段,再利用卷积神经网络提取不同长度的N-gram特征,构造不同粒度的相似度转移矩阵提取相似度特征。为了综合考虑字符级别和句子级别的语义信息,将证据信息构建成信息融合图,再利用基于核函数的注意力机制进行信息传递与证据推理。该算法在FEVER数据集上取得较好的效果,优于其他基于BERT的方法。
2021年10期 v.57;No.977 146-153页 [查看摘要][在线阅读][下载 1739K] [下载次数:185 ] |[网刊下载次数:0 ] |[引用频次:2 ] |[阅读次数:0 ] - 于国龙;赵勇;吴恋;崔忠伟;
为了提升标准量子粒子群算法(Quantum Particle Swarm Optimization,QPSO)的收敛精度,提出了基于粒子势阱长度变化率的粒子平均最优位置权重计算方法,通过平均最优位置的调节,来提升粒子的寻优能力,并将改进后的QPSO算法应用于深度置信网络(Depth Belief Network,DBN)模型的学习率参数寻优中,以便找到最优的DBN模型参数,来提升DBN模型的识别准确率。将通过改进后QPSO算法进行参数寻优的DBN网络(LQ_DBN)应用于蛋黄形状检测中,与现有典型的DBN网络模型对比表明,LQ_DBN模型在蛋黄形状检测实验中的识别准确率比CC-PSO-DBN、PSO_MDBN和标准DBN模型都要高,且检测识别准确率的稳定性也是四种对比模型中最高的,表明基于改进的QPSO算法的DBN网络模型取得了较好的优化效果。
2021年10期 v.57;No.977 154-162页 [查看摘要][在线阅读][下载 1969K] [下载次数:321 ] |[网刊下载次数:0 ] |[引用频次:9 ] |[阅读次数:0 ] - 于国龙;赵勇;吴恋;崔忠伟;
为了提升标准量子粒子群算法(Quantum Particle Swarm Optimization,QPSO)的收敛精度,提出了基于粒子势阱长度变化率的粒子平均最优位置权重计算方法,通过平均最优位置的调节,来提升粒子的寻优能力,并将改进后的QPSO算法应用于深度置信网络(Depth Belief Network,DBN)模型的学习率参数寻优中,以便找到最优的DBN模型参数,来提升DBN模型的识别准确率。将通过改进后QPSO算法进行参数寻优的DBN网络(LQ_DBN)应用于蛋黄形状检测中,与现有典型的DBN网络模型对比表明,LQ_DBN模型在蛋黄形状检测实验中的识别准确率比CC-PSO-DBN、PSO_MDBN和标准DBN模型都要高,且检测识别准确率的稳定性也是四种对比模型中最高的,表明基于改进的QPSO算法的DBN网络模型取得了较好的优化效果。
2021年10期 v.57;No.977 154-162页 [查看摘要][在线阅读][下载 1969K] [下载次数:321 ] |[网刊下载次数:0 ] |[引用频次:9 ] |[阅读次数:0 ] - 李艳;唐达明;周莹亮;戴庆瑜;
为解决老年人口日益增多而看护人员缺乏的问题,设计了一种具有自动跟随功能的智能轮椅系统。该系统通过计算机视觉传感器获取图像信息后,首先利用自适应高斯混合建模的背景减除法完成对目标的检测,再利用基于多特征融合的粒子滤波的TLD(Tracking-Learning-Detection)跟踪算法完成对目标的跟踪,最后结合双目定位算法得到目标在相机坐标系下的三维位置。根据目标的位置控制轮椅的速度和方向,使轮椅与目标人物保持设定的距离和相对方位,完成对目标的跟随。对轮椅跟随系统各项功能进行测试,结果表明,该系统不仅能够完成对使用者的实时跟随,同时也能实现对障碍物安全的躲避。
2021年10期 v.57;No.977 163-172页 [查看摘要][在线阅读][下载 2588K] [下载次数:787 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ] - 李艳;唐达明;周莹亮;戴庆瑜;
为解决老年人口日益增多而看护人员缺乏的问题,设计了一种具有自动跟随功能的智能轮椅系统。该系统通过计算机视觉传感器获取图像信息后,首先利用自适应高斯混合建模的背景减除法完成对目标的检测,再利用基于多特征融合的粒子滤波的TLD(Tracking-Learning-Detection)跟踪算法完成对目标的跟踪,最后结合双目定位算法得到目标在相机坐标系下的三维位置。根据目标的位置控制轮椅的速度和方向,使轮椅与目标人物保持设定的距离和相对方位,完成对目标的跟随。对轮椅跟随系统各项功能进行测试,结果表明,该系统不仅能够完成对使用者的实时跟随,同时也能实现对障碍物安全的躲避。
2021年10期 v.57;No.977 163-172页 [查看摘要][在线阅读][下载 2588K] [下载次数:787 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ] - 华洪;张志安;施振稳;陈冠星;
传统的A*算法仅适用于全局的静态环境,在求解路径规划问题时存在搜索效率低,路径不平滑等不足。针对这些问题,进行了以下改进:优化全局路径节点,引入删除冗余点准则与新增节点准则,使得全局路径更加平滑,更符合机器人运动学规律;结合滚动窗口法的思想,在每个滚动窗口内进行局部路径规划,首先根据前一步的节点信息确定局部子目标区域,然后在局部子目标区域内引入避障控制策略进行实时避障。最后通过Matlab软件建立多种栅格地图仿真,从路径轨迹的平滑度、搜索效率与局部规划能力方面将改进后的算法与原算法进行对比,并在动态环境下进行仿真分析,仿真结果表明改进后算法拥有良好局部规划能力,且路径轨迹更加平滑,在复杂环境下搜索效率更高。
2021年10期 v.57;No.977 173-180页 [查看摘要][在线阅读][下载 1943K] [下载次数:962 ] |[网刊下载次数:0 ] |[引用频次:51 ] |[阅读次数:0 ] - 华洪;张志安;施振稳;陈冠星;
传统的A*算法仅适用于全局的静态环境,在求解路径规划问题时存在搜索效率低,路径不平滑等不足。针对这些问题,进行了以下改进:优化全局路径节点,引入删除冗余点准则与新增节点准则,使得全局路径更加平滑,更符合机器人运动学规律;结合滚动窗口法的思想,在每个滚动窗口内进行局部路径规划,首先根据前一步的节点信息确定局部子目标区域,然后在局部子目标区域内引入避障控制策略进行实时避障。最后通过Matlab软件建立多种栅格地图仿真,从路径轨迹的平滑度、搜索效率与局部规划能力方面将改进后的算法与原算法进行对比,并在动态环境下进行仿真分析,仿真结果表明改进后算法拥有良好局部规划能力,且路径轨迹更加平滑,在复杂环境下搜索效率更高。
2021年10期 v.57;No.977 173-180页 [查看摘要][在线阅读][下载 1943K] [下载次数:962 ] |[网刊下载次数:0 ] |[引用频次:51 ] |[阅读次数:0 ]
- 徐景中;马丽娜;
在分析现有轮廓线提取方法不足的基础上,提出基于虚拟格网的建筑物轮廓线自动提取方法。该方法利用建筑物点云生成虚拟格网并进行二值填充;采用邻域分析方法进行边界格网的标记与追踪;为了避免边界追踪错误,设计了基于方向的单边缘格网抑制方法及基于距离的连接关系调整方法以改善提取结果质量;根据格网追踪结果,从原始建筑物点云中提取真实轮廓点以保持原始建筑物轮廓形态;采用随机抽样一致性估计及最小二乘拟合方法进行轮廓线规则化处理,实现建筑物轮廓线的自动提取。实验结果表明,该方法能快速从建筑物点云中提取轮廓线,可为建筑物轮廓线的自动提取提供一种可行的解决方案。
2021年10期 v.57;No.977 181-186页 [查看摘要][在线阅读][下载 1913K] [下载次数:354 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ] - 徐景中;马丽娜;
在分析现有轮廓线提取方法不足的基础上,提出基于虚拟格网的建筑物轮廓线自动提取方法。该方法利用建筑物点云生成虚拟格网并进行二值填充;采用邻域分析方法进行边界格网的标记与追踪;为了避免边界追踪错误,设计了基于方向的单边缘格网抑制方法及基于距离的连接关系调整方法以改善提取结果质量;根据格网追踪结果,从原始建筑物点云中提取真实轮廓点以保持原始建筑物轮廓形态;采用随机抽样一致性估计及最小二乘拟合方法进行轮廓线规则化处理,实现建筑物轮廓线的自动提取。实验结果表明,该方法能快速从建筑物点云中提取轮廓线,可为建筑物轮廓线的自动提取提供一种可行的解决方案。
2021年10期 v.57;No.977 181-186页 [查看摘要][在线阅读][下载 1913K] [下载次数:354 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ] - 蔡鉴明;张贤贤;梁月;
道路交通监控摄像机所能拍摄的最大场景范围已知,分析监控视频中交通流流动的规律,提出基于场景的压缩方法。通过运动在空间上的分布,建立运动能量图,取反获取掩模。改进HEVC编码方法,针对运动分布区域交通流的方向性强且运动剧烈特征,使用非对称模板改进TZSearch运动搜索算法;针对掩模区域运动性弱特征,提前设置运动搜索终止阈值。实验结果表明,与AVS2和MPEG-4编码相比,改进方法能够同时保证交通显著性以及压缩性能;与HEVC编码比较,改进方法的平均比特率节约、平均PSNR增效和平均时间节约分别为11.80%、3.90 dB和5.55%,车辆识别的准确率能够提高7.41%,增强了视频编码效率的同时强化了视频本身的分析性能。
2021年10期 v.57;No.977 187-193页 [查看摘要][在线阅读][下载 1941K] [下载次数:275 ] |[网刊下载次数:0 ] |[引用频次:3 ] |[阅读次数:0 ] - 蔡鉴明;张贤贤;梁月;
道路交通监控摄像机所能拍摄的最大场景范围已知,分析监控视频中交通流流动的规律,提出基于场景的压缩方法。通过运动在空间上的分布,建立运动能量图,取反获取掩模。改进HEVC编码方法,针对运动分布区域交通流的方向性强且运动剧烈特征,使用非对称模板改进TZSearch运动搜索算法;针对掩模区域运动性弱特征,提前设置运动搜索终止阈值。实验结果表明,与AVS2和MPEG-4编码相比,改进方法能够同时保证交通显著性以及压缩性能;与HEVC编码比较,改进方法的平均比特率节约、平均PSNR增效和平均时间节约分别为11.80%、3.90 dB和5.55%,车辆识别的准确率能够提高7.41%,增强了视频编码效率的同时强化了视频本身的分析性能。
2021年10期 v.57;No.977 187-193页 [查看摘要][在线阅读][下载 1941K] [下载次数:275 ] |[网刊下载次数:0 ] |[引用频次:3 ] |[阅读次数:0 ] - 胡文涛;陈秀宏;
传统的子空间学习算法包含投影学习和分类两个过程,但是这两个过程分离,且对离群点较敏感,可能导致算法无法获得整体最优解。为此,提出了一种基于局部保持投影的鲁棒稀疏子空间学习算法。该算法将特征学习和分类模型相结合,使学习得到的子空间特征更具有判别性;利用L2,1范数的行稀疏性质,剔除冗余特征,同时在算法模型中考虑数据样本的局部关系来提高对离群点的鲁棒性;最后采用交替迭代方法来求解该模型。在不同数据集上的实验结果表明该算法具有较好的识别效果。
2021年10期 v.57;No.977 194-199页 [查看摘要][在线阅读][下载 6659K] [下载次数:177 ] |[网刊下载次数:0 ] |[引用频次:5 ] |[阅读次数:0 ] - 胡文涛;陈秀宏;
传统的子空间学习算法包含投影学习和分类两个过程,但是这两个过程分离,且对离群点较敏感,可能导致算法无法获得整体最优解。为此,提出了一种基于局部保持投影的鲁棒稀疏子空间学习算法。该算法将特征学习和分类模型相结合,使学习得到的子空间特征更具有判别性;利用L2,1范数的行稀疏性质,剔除冗余特征,同时在算法模型中考虑数据样本的局部关系来提高对离群点的鲁棒性;最后采用交替迭代方法来求解该模型。在不同数据集上的实验结果表明该算法具有较好的识别效果。
2021年10期 v.57;No.977 194-199页 [查看摘要][在线阅读][下载 6659K] [下载次数:177 ] |[网刊下载次数:0 ] |[引用频次:5 ] |[阅读次数:0 ] - 刘艺;张起贵;
通用视频编码(Versatile Video Coding,VVC)是正在探索中的下一代视频编解码标准,在新标准的制定过程中,加入了许多新技术,在提升编码性能的同时,增加了编码复杂度。针对这种情况,通过对新标准编码过程中帧间预测单元划分算法的研究发现,在VVC进行帧间单元划分时,进行了多余的更深层次的划分,从而提高了编码复杂度。因此提出了一种划分层次限制的快速帧间预测算法,使单元划分提前结束,避免了多余的划分层次。实验结果表明,新算法在RA配置下,在增加1.58%的压缩率,损失0.036 2的图像失真度的情况下,编码复杂度降低了46.39%,从而验证了优化算法能有效降低编码复杂度。
2021年10期 v.57;No.977 200-203页 [查看摘要][在线阅读][下载 1461K] [下载次数:179 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ] - 刘艺;张起贵;
通用视频编码(Versatile Video Coding,VVC)是正在探索中的下一代视频编解码标准,在新标准的制定过程中,加入了许多新技术,在提升编码性能的同时,增加了编码复杂度。针对这种情况,通过对新标准编码过程中帧间预测单元划分算法的研究发现,在VVC进行帧间单元划分时,进行了多余的更深层次的划分,从而提高了编码复杂度。因此提出了一种划分层次限制的快速帧间预测算法,使单元划分提前结束,避免了多余的划分层次。实验结果表明,新算法在RA配置下,在增加1.58%的压缩率,损失0.036 2的图像失真度的情况下,编码复杂度降低了46.39%,从而验证了优化算法能有效降低编码复杂度。
2021年10期 v.57;No.977 200-203页 [查看摘要][在线阅读][下载 1461K] [下载次数:179 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ] - 顾书豪;李小霞;王学渊;张颖;陈菁菁;
路面裂缝检测是用以判断道路安全与否的关键技术,由于裂缝的背景复杂多样,传统的裂缝检测算法难以准确检测裂缝。提出了一种增强语义信息与多通道特征融合的裂缝自动检测算法。网络整体为编码器-解码器结构,在编码器部分引入扩张卷积模块,扩大特征图有效感受野,整合图像上下文信息,增强特征语义表达能力,提高像素分类精度。在解码器部分搭建了一个基于注意力机制的多通道特征融合模块,利用高层全局注意力信息指导高层语义特征与低层细节特征的逐级融合,有利于恢复图像细节信息,进一步提升对裂缝的像素级检测精度。实验结果表明,在CRACK500公开数据集上训练的模型在测试集上取得72.5%的平均交并比(Intersection over Union,IoU)和96.8%的F1score,该模型直接用于CrackForest数据集测试,平均IoU和F1score分别提升2.0个百分点和1.1个百分点,表明模型具有很好的泛化性能,可用于复杂道路场景下的裂缝检测与质量评估。
2021年10期 v.57;No.977 204-210页 [查看摘要][在线阅读][下载 2172K] [下载次数:444 ] |[网刊下载次数:0 ] |[引用频次:19 ] |[阅读次数:0 ] - 顾书豪;李小霞;王学渊;张颖;陈菁菁;
路面裂缝检测是用以判断道路安全与否的关键技术,由于裂缝的背景复杂多样,传统的裂缝检测算法难以准确检测裂缝。提出了一种增强语义信息与多通道特征融合的裂缝自动检测算法。网络整体为编码器-解码器结构,在编码器部分引入扩张卷积模块,扩大特征图有效感受野,整合图像上下文信息,增强特征语义表达能力,提高像素分类精度。在解码器部分搭建了一个基于注意力机制的多通道特征融合模块,利用高层全局注意力信息指导高层语义特征与低层细节特征的逐级融合,有利于恢复图像细节信息,进一步提升对裂缝的像素级检测精度。实验结果表明,在CRACK500公开数据集上训练的模型在测试集上取得72.5%的平均交并比(Intersection over Union,IoU)和96.8%的F1score,该模型直接用于CrackForest数据集测试,平均IoU和F1score分别提升2.0个百分点和1.1个百分点,表明模型具有很好的泛化性能,可用于复杂道路场景下的裂缝检测与质量评估。
2021年10期 v.57;No.977 204-210页 [查看摘要][在线阅读][下载 2172K] [下载次数:444 ] |[网刊下载次数:0 ] |[引用频次:19 ] |[阅读次数:0 ]
- 赵怡;高淑萍;何迪;
针对传统数据融合算法在多场景下的眼动跟踪数据融合效果较差的问题,提出一种新的基于深度学习的眼动跟踪数据融合算法,即Eye-CNN-BLSTM算法。该算法在原始眼动跟踪数据空间位置信息基础上添加新的人工特征;将卷积神经网络(Convolutional Neural Network,CNN)与双向长短时记忆网络(Bi-directional Long ShortTerm Memory,BLSTM)结合,设计了新的融合结构。实验结果表明,与六种经典数据融合算法相比,该算法在OTB-100数据集上融合性能更优。
2021年10期 v.57;No.977 211-217页 [查看摘要][在线阅读][下载 7259K] [下载次数:660 ] |[网刊下载次数:0 ] |[引用频次:5 ] |[阅读次数:0 ] - 赵怡;高淑萍;何迪;
针对传统数据融合算法在多场景下的眼动跟踪数据融合效果较差的问题,提出一种新的基于深度学习的眼动跟踪数据融合算法,即Eye-CNN-BLSTM算法。该算法在原始眼动跟踪数据空间位置信息基础上添加新的人工特征;将卷积神经网络(Convolutional Neural Network,CNN)与双向长短时记忆网络(Bi-directional Long ShortTerm Memory,BLSTM)结合,设计了新的融合结构。实验结果表明,与六种经典数据融合算法相比,该算法在OTB-100数据集上融合性能更优。
2021年10期 v.57;No.977 211-217页 [查看摘要][在线阅读][下载 7259K] [下载次数:660 ] |[网刊下载次数:0 ] |[引用频次:5 ] |[阅读次数:0 ] - 黄英来;温馨;任洪娥;王佳琪;
深度学习和迁移学习的兴起为树种识别提供了新方向,然而其在同树种内不同品质间木材识别仍存在挑战。为改善古筝面板品质分级现状,设计了一种深度残差网络模型。首先将数据集进行划分并采用数据增强技术来扩充训练样本,然后将ImageNet上经过预训练的模型迁移到该问题上。为高效提取到板材图像特征,在预训练模型后新增深层特征提取部分,其融合了残差连接和深度可分离卷积,不仅可增强特征重利用率和缓解梯度消失,而且有利于提取到图像深层特征。最后为提升模型在训练过程中的鲁棒性,使用LeakyReLU函数代替ReLU函数避免神经元死亡问题。该方法在泡桐导管图像数据集上测试精度达到了92.8%,对比其他主流方法,该模型可节省古筝品质分级时间,提高识别精度。
2021年10期 v.57;No.977 218-224页 [查看摘要][在线阅读][下载 1675K] [下载次数:374 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ] - 黄英来;温馨;任洪娥;王佳琪;
深度学习和迁移学习的兴起为树种识别提供了新方向,然而其在同树种内不同品质间木材识别仍存在挑战。为改善古筝面板品质分级现状,设计了一种深度残差网络模型。首先将数据集进行划分并采用数据增强技术来扩充训练样本,然后将ImageNet上经过预训练的模型迁移到该问题上。为高效提取到板材图像特征,在预训练模型后新增深层特征提取部分,其融合了残差连接和深度可分离卷积,不仅可增强特征重利用率和缓解梯度消失,而且有利于提取到图像深层特征。最后为提升模型在训练过程中的鲁棒性,使用LeakyReLU函数代替ReLU函数避免神经元死亡问题。该方法在泡桐导管图像数据集上测试精度达到了92.8%,对比其他主流方法,该模型可节省古筝品质分级时间,提高识别精度。
2021年10期 v.57;No.977 218-224页 [查看摘要][在线阅读][下载 1675K] [下载次数:374 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ] - 张晓楠;姜帅;南婧雯;
为应对"双十一""618"需求突发性爆涨下物流配送网络的爆仓、滞缓等问题,提出能够兼顾配送系统稳定性和配送路线竞争性的"半柔性覆盖策略",研究半柔性覆盖的多配送中心路线优化问题。在传统配送中心路线优化问题的基础上,根据地理位置,区分固定需求点和柔性需求点,定义固定需求点只能由所属配送中心服务,而柔性需求点可由多个配送中心协同服务;以总成本最小为目标,建立半柔性覆盖的多配送中心路线优化模型;设计遗传算法求解,使用Matlab编译;选取申通快递在西安北郊地区的五个配送站点为实例进行求解,将求解结果与原始路线、"全柔性覆盖策略"和"固定分区策略"进行对比,验证了"半柔性覆盖策略"的有效性。
2021年10期 v.57;No.977 225-232页 [查看摘要][在线阅读][下载 1707K] [下载次数:531 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ] - 张晓楠;姜帅;南婧雯;
为应对"双十一""618"需求突发性爆涨下物流配送网络的爆仓、滞缓等问题,提出能够兼顾配送系统稳定性和配送路线竞争性的"半柔性覆盖策略",研究半柔性覆盖的多配送中心路线优化问题。在传统配送中心路线优化问题的基础上,根据地理位置,区分固定需求点和柔性需求点,定义固定需求点只能由所属配送中心服务,而柔性需求点可由多个配送中心协同服务;以总成本最小为目标,建立半柔性覆盖的多配送中心路线优化模型;设计遗传算法求解,使用Matlab编译;选取申通快递在西安北郊地区的五个配送站点为实例进行求解,将求解结果与原始路线、"全柔性覆盖策略"和"固定分区策略"进行对比,验证了"半柔性覆盖策略"的有效性。
2021年10期 v.57;No.977 225-232页 [查看摘要][在线阅读][下载 1707K] [下载次数:531 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ] - 张东梅;买日旦·吾守尔;古兰拜尔·吐尔洪;
为实现对高维混合、不平衡信贷数据中的不良贷款者的准确预测,从降维预处理和分类算法两方面进行优化,提出一种基于混合数据主成分分析(Principal Component Analysis of Mixed Data,PCAmix)预处理的单类K近邻(K-Nearest Neighbor,KNN)计算均值算法。针对传统的主成分分析(Principal Component Analysis,PCA)不能直接处理定性变量的问题,使用PCAmix降维预处理数据,为规避不平衡数据在二分类模型中性能较差的缺点,采用单类分类和K近邻算法邻居计算的思想,仅采用多数类训练模型。利用Bootstrap方法找到最佳的决策边界,使得正负样本最大限度地分离,最终准确预测客户的违约风险。采用UCI数据库中的German和Default个人信用评分数据集进行验证,实验结果表明该算法在处理高维混合、不平衡的信贷数据上具有较好的分类效果。
2021年10期 v.57;No.977 233-240页 [查看摘要][在线阅读][下载 1576K] [下载次数:309 ] |[网刊下载次数:0 ] |[引用频次:8 ] |[阅读次数:0 ] - 张东梅;买日旦·吾守尔;古兰拜尔·吐尔洪;
为实现对高维混合、不平衡信贷数据中的不良贷款者的准确预测,从降维预处理和分类算法两方面进行优化,提出一种基于混合数据主成分分析(Principal Component Analysis of Mixed Data,PCAmix)预处理的单类K近邻(K-Nearest Neighbor,KNN)计算均值算法。针对传统的主成分分析(Principal Component Analysis,PCA)不能直接处理定性变量的问题,使用PCAmix降维预处理数据,为规避不平衡数据在二分类模型中性能较差的缺点,采用单类分类和K近邻算法邻居计算的思想,仅采用多数类训练模型。利用Bootstrap方法找到最佳的决策边界,使得正负样本最大限度地分离,最终准确预测客户的违约风险。采用UCI数据库中的German和Default个人信用评分数据集进行验证,实验结果表明该算法在处理高维混合、不平衡的信贷数据上具有较好的分类效果。
2021年10期 v.57;No.977 233-240页 [查看摘要][在线阅读][下载 1576K] [下载次数:309 ] |[网刊下载次数:0 ] |[引用频次:8 ] |[阅读次数:0 ] - 黎晓昀;贾杰;
针对监控视频中斗殴行为检测的需求,提出了一种新的基于三维卷积神经网络和视频帧采样算法的斗殴行为检测方法。针对监控视频行为检测起始定位的难点,提出了一种利用基于人体姿态信息的关键区域检测算法定位斗殴行为起始帧的方法,形成了斗殴行为预识别空间。针对深度学习训练数据冗余和优化程度不够的问题,提出了基于时间采样的视频帧采样算法,并且搭建了一个三维卷积神经网络,使网络学习到整个行为动作的时空信息。实验结果证明了所提方法在两个公共数据集上取得了优越的性能。
2021年10期 v.57;No.977 241-245页 [查看摘要][在线阅读][下载 1695K] [下载次数:234 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ] - 黎晓昀;贾杰;
针对监控视频中斗殴行为检测的需求,提出了一种新的基于三维卷积神经网络和视频帧采样算法的斗殴行为检测方法。针对监控视频行为检测起始定位的难点,提出了一种利用基于人体姿态信息的关键区域检测算法定位斗殴行为起始帧的方法,形成了斗殴行为预识别空间。针对深度学习训练数据冗余和优化程度不够的问题,提出了基于时间采样的视频帧采样算法,并且搭建了一个三维卷积神经网络,使网络学习到整个行为动作的时空信息。实验结果证明了所提方法在两个公共数据集上取得了优越的性能。
2021年10期 v.57;No.977 241-245页 [查看摘要][在线阅读][下载 1695K] [下载次数:234 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ] - 章诗琪;魏斐斐;范馨月;
为完善安全为第一因素的路线规划导航系统,突出"以人为本"的理念,基于OD(Origin-Destination)的路段选择,综合考虑贵阳市交通事故数据和天气数据两大影响线路风险系数的因素。建立泊松分布模型和马尔可夫模型,分析区域内交通事故易发点在晴天、阴天、雨天发生交通事故点概率和路线概率,构建风险系数指标。针对模型求得的路线安全系数采用最大决策法选出最优安全路线。结果表明,贵阳市不同天气下发生的交通事故频率有差异,检验每个地点发生交通事故数服从泊松分布;现有导航软件推荐的第一路线并不是最优路线,第二条路线才是安全系数最大的路线。基于泊松分布模型和马尔可夫模型计算交通事故发生概率,为现有导航软件中增添了安全系数为第一参考值的人性化设置,有较好的社会价值和推广性。
2021年10期 v.57;No.977 246-251页 [查看摘要][在线阅读][下载 1479K] [下载次数:562 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ] - 章诗琪;魏斐斐;范馨月;
为完善安全为第一因素的路线规划导航系统,突出"以人为本"的理念,基于OD(Origin-Destination)的路段选择,综合考虑贵阳市交通事故数据和天气数据两大影响线路风险系数的因素。建立泊松分布模型和马尔可夫模型,分析区域内交通事故易发点在晴天、阴天、雨天发生交通事故点概率和路线概率,构建风险系数指标。针对模型求得的路线安全系数采用最大决策法选出最优安全路线。结果表明,贵阳市不同天气下发生的交通事故频率有差异,检验每个地点发生交通事故数服从泊松分布;现有导航软件推荐的第一路线并不是最优路线,第二条路线才是安全系数最大的路线。基于泊松分布模型和马尔可夫模型计算交通事故发生概率,为现有导航软件中增添了安全系数为第一参考值的人性化设置,有较好的社会价值和推广性。
2021年10期 v.57;No.977 246-251页 [查看摘要][在线阅读][下载 1479K] [下载次数:562 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ] - 梁新荣;肖龙;王雪奇;杨世武;董海荣;
高速列车速度跟踪控制系统是一个复杂的非线性系统,难以取得高精度的跟踪性能。为了减少速度跟踪误差,设计了高速列车神经网络PID控制器。首先建立了描述列车运行过程的单位移多质点模型,该模型考虑了列车的基本阻力和附加阻力以及车厢之间的相互作用力。然后阐述了BP神经网络PID控制,并设计了列车速度跟踪控制器,根据速度误差用神经网络PID控制决定牵引力和制动力。最后与模糊控制和常规PID控制进行了仿真对比,结果表明,神经网络PID控制具有很小的速度跟踪误差和优越的速度跟踪性能,可以满足列车正点运行的需求。
2021年10期 v.57;No.977 252-258页 [查看摘要][在线阅读][下载 1442K] [下载次数:805 ] |[网刊下载次数:0 ] |[引用频次:29 ] |[阅读次数:0 ] - 梁新荣;肖龙;王雪奇;杨世武;董海荣;
高速列车速度跟踪控制系统是一个复杂的非线性系统,难以取得高精度的跟踪性能。为了减少速度跟踪误差,设计了高速列车神经网络PID控制器。首先建立了描述列车运行过程的单位移多质点模型,该模型考虑了列车的基本阻力和附加阻力以及车厢之间的相互作用力。然后阐述了BP神经网络PID控制,并设计了列车速度跟踪控制器,根据速度误差用神经网络PID控制决定牵引力和制动力。最后与模糊控制和常规PID控制进行了仿真对比,结果表明,神经网络PID控制具有很小的速度跟踪误差和优越的速度跟踪性能,可以满足列车正点运行的需求。
2021年10期 v.57;No.977 252-258页 [查看摘要][在线阅读][下载 1442K] [下载次数:805 ] |[网刊下载次数:0 ] |[引用频次:29 ] |[阅读次数:0 ] - 文达;崔双喜;樊小朝;降国俊;
针对主动配电网中清洁能源消纳率低、负荷侧资源调度不足的问题,提出了一种包含负荷层和主动配网层的两层优化调度模型。负荷层首先根据负荷参与调度的形式不同分类建模,然后通过源荷协调互动调整柔性负荷用电时序及清洁能源的出力;主动配网层则依据分时电价优化系统的综合运行成本,提出禁忌-细胞膜优化算法对模型求解。通过算例对比分析了分层、分类负荷前后三种方案下优化调度的结果,证明了提出的优化调度模型在配网系统经济运行的前提下,可以有效提高清洁能源的消纳率,进一步降低负荷峰谷差,同时验证了算法的有效性。
2021年10期 v.57;No.977 259-265页 [查看摘要][在线阅读][下载 1552K] [下载次数:609 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ] - 文达;崔双喜;樊小朝;降国俊;
针对主动配电网中清洁能源消纳率低、负荷侧资源调度不足的问题,提出了一种包含负荷层和主动配网层的两层优化调度模型。负荷层首先根据负荷参与调度的形式不同分类建模,然后通过源荷协调互动调整柔性负荷用电时序及清洁能源的出力;主动配网层则依据分时电价优化系统的综合运行成本,提出禁忌-细胞膜优化算法对模型求解。通过算例对比分析了分层、分类负荷前后三种方案下优化调度的结果,证明了提出的优化调度模型在配网系统经济运行的前提下,可以有效提高清洁能源的消纳率,进一步降低负荷峰谷差,同时验证了算法的有效性。
2021年10期 v.57;No.977 259-265页 [查看摘要][在线阅读][下载 1552K] [下载次数:609 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ] - 任新惠;王柳;
随着城市即时配送及餐饮业迅猛发展带来的高时效性配送热潮,配送员自身安全及配送效率的矛盾急剧突出,一种兼具安全与效率的无人机即时配送新模式应运而生。无人机全自动机场正是实现零接触式配送的落脚点。基于无人机及无人机全自动机场自身特性的约束,构建以取货时间最短为目标的选址模型,确定无人机全自动机场的选址位置及根据排队论确定机场数量。随着顾客对于无人机全自动机场取货距离的减小,无人机机场选址位置的数量也会相应增加,而每个选址位置下的机场数目变少,相对应的顾客在无人机机场前的排队等候时间会逐渐上升。
2021年10期 v.57;No.977 266-272页 [查看摘要][在线阅读][下载 3519K] [下载次数:1016 ] |[网刊下载次数:0 ] |[引用频次:11 ] |[阅读次数:0 ] - 任新惠;王柳;
随着城市即时配送及餐饮业迅猛发展带来的高时效性配送热潮,配送员自身安全及配送效率的矛盾急剧突出,一种兼具安全与效率的无人机即时配送新模式应运而生。无人机全自动机场正是实现零接触式配送的落脚点。基于无人机及无人机全自动机场自身特性的约束,构建以取货时间最短为目标的选址模型,确定无人机全自动机场的选址位置及根据排队论确定机场数量。随着顾客对于无人机全自动机场取货距离的减小,无人机机场选址位置的数量也会相应增加,而每个选址位置下的机场数目变少,相对应的顾客在无人机机场前的排队等候时间会逐渐上升。
2021年10期 v.57;No.977 266-272页 [查看摘要][在线阅读][下载 3519K] [下载次数:1016 ] |[网刊下载次数:0 ] |[引用频次:11 ] |[阅读次数:0 ] - 陈展;公建宁;刘媛媛;徐京邦;
在多自动导引车(Automated Guided Vehicles,AGV)系统的路径规划中,构建AGV的拓扑结构地图模型,设计基于全局邻域搜索的禁忌算法,以高效准确地解决最短路径的组合优化问题,并进行不同规模算例下的分组实验,验证禁忌搜索算法对路径能耗属性、时间属性和路径负载均衡目标参数的优化效果,来提高多AGV系统的稳定性和高效性。
2021年10期 v.57;No.977 273-278页 [查看摘要][在线阅读][下载 1582K] [下载次数:1141 ] |[网刊下载次数:0 ] |[引用频次:40 ] |[阅读次数:0 ] - 陈展;公建宁;刘媛媛;徐京邦;
在多自动导引车(Automated Guided Vehicles,AGV)系统的路径规划中,构建AGV的拓扑结构地图模型,设计基于全局邻域搜索的禁忌算法,以高效准确地解决最短路径的组合优化问题,并进行不同规模算例下的分组实验,验证禁忌搜索算法对路径能耗属性、时间属性和路径负载均衡目标参数的优化效果,来提高多AGV系统的稳定性和高效性。
2021年10期 v.57;No.977 273-278页 [查看摘要][在线阅读][下载 1582K] [下载次数:1141 ] |[网刊下载次数:0 ] |[引用频次:40 ] |[阅读次数:0 ]