计算机工程与应用


热点与综述

  • 深度学习小目标检测算法研究综述

    张艳;张明路;吕晓玲;郭策;蒋志宏;

    目标检测的主要目的是在图像中快速精准地识别定位出预定义类别的目标。而随着深度学习技术的不断发展,检测算法在相应行业大、中目标已达到了不错的成效。鉴于小目标在图像中尺寸较小、特征不全、与图像中背景差异大等特点,基于深度学习的小目标检测算法性能仍需要进一步提升和优化;小目标检测在无人驾驶、医疗诊断、无人机导航等多个领域都有着广泛的需求,因此研究有着很高的应用价值。在文献调研的基础上,先给出小目标检测定义,找到当前小目标检测的重难点;根据这些重难点从六个研究方向分析当前研究现状,并总结各算法优缺点;结合文献及发展现状对该领域未来的研究方向做出合理预测与展望,为后续研究提供一定基础参考。

    2022年15期 v.58;No.1006 1-17页 [查看摘要][在线阅读][下载 1750K]
    [下载次数:6419 ] |[网刊下载次数:0 ] |[引用频次:47 ] |[阅读次数:0 ]
  • 跨域图像检索综述

    李浩然;周小平;王佳;

    受成像载体、成像光谱和成像条件等的影响,跨域图像在不同领域的应用日益增多,跨域图像检索已成为了许多领域研究的热点和前言。然而图像的跨域检索面临着图像视觉偏差的问题,通过传统同域图像检索的方法无法有效地得到结果。通过文献调研,系统梳理了近年来跨域图像检索领域的代表性方法。对跨域图像检索任务作出了简要说明并指出了关键问题;根据图像域的不同转换阶段,将跨域图像检索方法分为两类:基于特征空间迁移和基于图像域迁移的跨域图像检索方法,并对两类方法进行了系统总结和分析;整理了跨域图像检索在不同领域的数据集,对比了各类方法的性能;总结了现有跨域检索方法并对未来的研究方向进行了展望。

    2022年15期 v.58;No.1006 18-36页 [查看摘要][在线阅读][下载 1873K]
    [下载次数:513 ] |[网刊下载次数:0 ] |[引用频次:5 ] |[阅读次数:0 ]
  • 开源网络地理信息系统的技术体系与研究进展

    木啸林;牛坤龙;蔡世荣;杨现坤;王晋年;

    免费开源软件的进步促进了开源网络地理信息系统的发展,使其呈现多样的技术体系和应用模式。为准确了解其当前的技术体系、功能特征和应用领域等,综述了当前主流开源网络地理信息系统软件、开发工具、系统特点、研发模式及典型应用,并归纳了当前发展趋势。为国产网络地理信息系统开发和技术应用提供技术参考和经验借鉴。

    2022年15期 v.58;No.1006 37-51页 [查看摘要][在线阅读][下载 1568K]
    [下载次数:1152 ] |[网刊下载次数:0 ] |[引用频次:7 ] |[阅读次数:0 ]
  • 多标签特征选择研究进展

    周慧颖;汪廷华;张代俐;

    特征选择一直是机器学习和数据挖掘中的一个重要问题。在多标签学习任务中,数据集中的每个样本都与多个标签相关联,标签与标签之间通常也是相关的。在多标签高维数据分析中,为降低特征维数和提高分类性能,研究者们提出了多标签特征选择方法。系统综述了多标签特征选择的研究进展。在介绍多标签分类以及评价准则之后,详细分析了多标签特征选择的三类方法,即过滤式算法、包裹式算法和嵌入式算法,对多标签特征选择未来的研究提出展望。

    2022年15期 v.58;No.1006 52-67页 [查看摘要][在线阅读][下载 1614K]
    [下载次数:1108 ] |[网刊下载次数:0 ] |[引用频次:20 ] |[阅读次数:0 ]
  • 基于YOLO的自动驾驶目标检测研究综述

    茅智慧;朱佳利;吴鑫;李君;

    自动驾驶是人工智能发展领域的一个重要方向,拥有良好的发展前景,而实时准确的目标检测与识别是保证自动驾驶汽车安全稳定运行的基础与关键。回顾自动驾驶和目标检测技术的发展历程,综述了YOLO算法在车辆、行人、交通标志、灯光、车道线等目标检测上的应用,同时对比分析了精确性与实时性等性能,阐述了自动驾驶目标检测研究领域将要面临的挑战、可能的解决方案和潜在的发展方向。

    2022年15期 v.58;No.1006 68-77页 [查看摘要][在线阅读][下载 1560K]
    [下载次数:5115 ] |[网刊下载次数:0 ] |[引用频次:29 ] |[阅读次数:0 ]

理论与研发

  • 纯策略纳什均衡的博弈强化学习

    王军;曹雷;陈希亮;陈英;赵芷若;

    将博弈理论与多智能体强化学习结合形成博弈强化学习逐渐受到关注,但是也存在算法的计算复杂度高和无法保证纯策略纳什均衡的问题。Meta equilibrium Q-learning算法通过反应函数将原始博弈转换为元博弈,而元博弈推导出的元均衡是纯策略纳什均衡。该算法在保证纯策略纳什均衡的前提下能够使得每个智能体的回报不低于某特定阈值。同时,基于分形的均衡程度评估模型能够通过计算任意状态的分形维数来判断其稳态,并评估任意状态与均衡状态之间的距离,该模型可以检验元均衡的科学性与合理性,上述算法和模型的相关结论在福利博弈和夺控战中都得到具体验证。

    2022年15期 v.58;No.1006 78-86页 [查看摘要][在线阅读][下载 1733K]
    [下载次数:1216 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ]
  • 相位转移熵在再认记忆脑网络中的应用研究

    齐云鹏;王苏弘;陈芋圻;邹凌;

    为研究具有不同先验记忆群体的再认记忆脑功能网络差异,引入相位转移熵方法,分析36名中国医学生与37名中国非医学生执行图片再认任务时的脑功能网络。将脑电信号经希尔伯特变换转为瞬时相位数据,使用相空间分箱和实验折叠相结合的方法计算出边际熵和联合熵项,根据相位转移熵定义计算导联之间的相位转移熵,以导联为网络节点,将相位转移熵作为网络的边,并结合复杂网络方法对网络进行分析。结果发现,在20~30 Hz频率范围内,医学生的节点出强度、入强度、局部效率和全局效率(P <0.05)低于非医学生;在额叶部位,医学生的网络枢纽强度均小于非医学生;在左颞叶和右枕叶之间,医学生的大脑信息流向与非医学生相反。相比传统方法,脑网络能够挖掘出更丰富的差异信息。该结果为再认记忆的脑网络研究提供支持。

    2022年15期 v.58;No.1006 87-94页 [查看摘要][在线阅读][下载 1897K]
    [下载次数:255 ] |[网刊下载次数:0 ] |[引用频次:2 ] |[阅读次数:0 ]

大数据与云计算

  • 基于深度学习的专利知识推荐服务研究

    李振宇;战洪飞;余军合;王瑞;邓慧君;

    专利作为一种包含大多数领域中最完整的设计信息,可以为设计者解决设计问题提供有价值的指导。针对现有的专利推荐方法难以有效地推荐跨领域专利的问题,提出一种基于深度学习的跨领域专利知识推荐方法,用于创新产品的概念设计。对产品功能和知识需求情境进行建模,将设计问题进行标准化表达,生成设计问题空间。提出一种半监督学习算法(TG-TCI)将专利功能信息按照功能基自动分类和标记,利用实体识别算法(BERT-BiLSTMCRF)提取专利应用场景术语、技术术语,结合国际专利分类(IPC)信息以表示专利的功能、情境、技术和领域属性,从而生成专利知识空间。通过设计问题空间到专利知识空间的功能基和知识情境映射查找所需的跨领域专利,根据技术和领域属性对它们进行聚类和评估,选出特定的专利以激发设计者的创造力。以一个实际案例进行分析验证,证明了基于深度学习的专利知识推荐模型的可行性及有效性。

    2022年15期 v.58;No.1006 95-109页 [查看摘要][在线阅读][下载 2025K]
    [下载次数:1263 ] |[网刊下载次数:0 ] |[引用频次:8 ] |[阅读次数:0 ]
  • 大数据下基于特征图的深度卷积神经网络

    毛伊敏;张瑞朋;高波;

    针对大数据环境下DCNN(deep convolutional neural network)算法中存在网络冗余参数过多、参数寻优能力不佳和并行效率低的问题,提出了大数据环境下基于特征图和并行计算熵的深度卷积神经网络算法MR-FPDCNN(deep convolutional neural network algorithm based on feature graph and parallel computing entropy using MapReduce)。该算法设计了基于泰勒损失的特征图剪枝策略FMPTL(feature map pruning based on Taylor loss),预训练网络,获得压缩后的DCNN,有效减少了冗余参数,降低了DCNN训练的计算代价。提出了基于信息共享搜索策略ISS(information sharing strategy)的萤火虫优化算法IFAS(improved firefly algorithm based on ISS),根据“IFAS”算法初始化DCNN参数,实现DCNN的并行化训练,提高网络的寻优能力。在Reduce阶段提出了基于并行计算熵的动态负载均衡策略DLBPCE(dynamic load balancing strategy based on parallel computing entropy),获取全局训练结果,实现了数据的快速均匀分组,从而提高了集群的并行效率。实验结果表明,该算法不仅降低了DCNN在大数据环境下训练的计算代价,而且提高了并行系统的并行化性能。

    2022年15期 v.58;No.1006 110-116页 [查看摘要][在线阅读][下载 1520K]
    [下载次数:241 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ]

网络、通信与安全

  • 基于LSCP算法的比特币网络异常交易检测

    廖茜;顾益军;

    异常检测是比特币交易数据分析的研究热点之一。针对现有的基于机器学习的异常交易检测方法难以对多种异常类型进行准确概括、泛化能力不足的问题,对比特币交易数据构建网络结构并提取异常行为模式相关特征,应用基于局部动态选择组合的并行集成算法(LSCP)构建检测模型,并在算法中融入7种经典的异常检测算法,利用基学习器对不同异常类型的敏感性,提升检测模型的可靠性和稳定性。实验结果表明,与传统的检测方法相比,结合异构基学习器的LSCP算法在整体检测性能上具有更好的效果。

    2022年15期 v.58;No.1006 117-123页 [查看摘要][在线阅读][下载 1503K]
    [下载次数:580 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ]
  • MTD增强的网络欺骗防御系统

    高春刚;王永杰;熊鑫立;

    计算机网络正在飞速发展,但随之而来的系统破坏、信息泄露等网络安全问题也日益突出。攻击者在正式攻击前通常进行大量的网络侦查,以发现目标网络和系统上的可利用漏洞,而传统网络系统中的静态配置为攻击者发现网络目标和发起攻击提供了极大的优势。为了减轻攻击者持续性网络侦查攻击的有效性,基于软件定义网络开发了移动目标防御(moving target defense,MTD)增强的网络欺骗防御系统。该系统采用网络欺骗技术,混淆攻击者收集到的目标网络和系统信息,延长攻击者扫描到网络内真实脆弱性主机的时间,提高其时间成本;并在此基础上融合移动目标防御技术,动态随机地变换网络内节点的IP地址,增强网络欺骗系统的防御效能。实现了系统原型并对其进行评估,在虚拟网络拓扑规模为3个网段且地址变换周期为30 s的配置下,该系统将攻击者发现脆弱性主机的时间平均延迟7倍,将攻击者成功攻击脆弱性主机的概率降低83%,同时系统额外开销平均在8%以内。

    2022年15期 v.58;No.1006 124-132页 [查看摘要][在线阅读][下载 1576K]
    [下载次数:400 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ]

模式识别与人工智能

  • 舒尔特方格与LSTM的注意力分级建模

    王湃;吴凡;汪梅;秦学斌;

    在基于脑电信号的注意力分级研究中,存在两个亟待解决的技术难点。第一不同注意类型的脑电数据采集及标注困难;第二脑电特征提取算法忽视原始脑电信号时序特征。针对以上问题,设计了基于视觉搜索和反应时技术的舒尔特方格范式,实现对不同注意类型脑电数据的采集以及自动标注;设计长短期记忆深度学习网络(LSTM)实现对注意力分级,保存原始脑电信号的时序特征。实验结果表明,注意力分级模型可以很好区分高中低三种注意力水平;对比现有的五种基于EEG信号的注意力分级算法,小波变换(DWT)、近似熵、共空间模式(CSP)、基于相干系数的脑网络和卷积神经网络(CNN),在相同的EEG数据集上,该注意力分级模型识别准确率最高,高出DWT算法21.49个百分点;高出近似熵算法25.82个百分点;高出CSP算法20.53个百分点;高出基于相干系数的脑网络算法13.32个百分点;高出CNN9.05个百分点。

    2022年15期 v.58;No.1006 133-140页 [查看摘要][在线阅读][下载 1758K]
    [下载次数:786 ] |[网刊下载次数:0 ] |[引用频次:2 ] |[阅读次数:0 ]
  • 域通用和域分离字典对学习的行人重识别算法

    颜悦;严双林;颜昌沁;

    为克服不同相机视角之间的域偏移问题,提出一种基于域通用和域分离字典对学习的跨视角行人重识别算法。具体地,基于来自同一相机视角下的行人共享相同的域,并且同一视角中每个行人图像所携带的域信息在短时间内具有一致性,将同一视角下的行人图像分解为特定视角的域信息分量和域分离的行人外观特征分量,提出一个判别字典学习模型以创建用于描述域信息分量的域通用字典和描述行人外观分量的域分离字典。由于来自同一相机视角下的图像具有域相似性,因此通过低秩正则化来细化用于表示域信息的字典。为了进一步提高学习字典的判别能力,在算法中约束相同视角、相同身份的多幅图像的编码系数具有很强的相似性。此外,采用一种新颖的扩展正则化方法来解决不同行人相似外貌特征和同一行人不同外貌特征的视觉外观歧义问题。在四个具有挑战性的数据集上进行实验,结果表明域通用和域分离字典对学习的算法相对于一些现有最新算法更具有效性和优越性。

    2022年15期 v.58;No.1006 141-152页 [查看摘要][在线阅读][下载 1863K]
    [下载次数:127 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 基于双分支网络联合训练的虚假新闻检测

    郭铃霓;黄舰;吴兴财;杨振国;刘文印;

    虚假新闻在社交媒体上的广泛传播,给社会带来了不同程度的负面影响。针对虚假新闻早期检测任务中,社交上下文信息不充分的问题,提出一种基于双分支网络联合训练的虚假新闻检测模型。该模型由最大池化网络分支(max pooling branch,MPB)和广义均值池化网络分支(generalized mean pooling branch,GPB)组成。MPB采用卷积神经网络对新闻文章进行文本特征提取,GPB引入了可训练的池化层,学习新闻文章潜在的语义特征。同时,在每个分支网络中,对新闻标题和正文之间进行语义关联性度量。最终,对两个分支网络联合训练后的结果进行决策融合,判断新闻的真实性。实验结果表明,提出的模型在准确率、召回率、F1值评测指标上均优于基线模型,F1值达到94.1%,比最优的基线模型提升了6.4个百分点。

    2022年15期 v.58;No.1006 153-161页 [查看摘要][在线阅读][下载 1699K]
    [下载次数:439 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ]
  • 基于动态影响图的股市趋势预测

    姚宏亮;徐礼维;杨静;俞奎;

    历史数据对未来状态的影响具有隐蔽性,导致基于数据的股市趋势预测是一个公开难题。为了有效地发现历史数据对股市未来状态的影响力,利用动态影响图建模成交量和K线形态之间的结构关系,提出一种基于量价结构关系的联合树推理预测算法(VP-JT)。提取股票的阶段成交量特征和阶段K线形态特征,给出阶段成交量对于股市价格影响的作用原理;利用配合度量化当前阶段成交量与K线形态之间关系一致性程度;利用动态影响图建模阶段量价在时间上的作用过程;通过联合树的自动推理对股市未来状态进行预测。在实际数据上进行实现和算法比较,实验结果表明量价结构关系的联合树推理算法具有更高的准确率。

    2022年15期 v.58;No.1006 162-168页 [查看摘要][在线阅读][下载 1659K]
    [下载次数:336 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ]
  • 基于情景记忆的运动小目标行人检测神经网络

    张本康;胡滨;

    从视觉场景中可靠地检测小目标行人对象是构建未来人工智能视觉系统的重要基础。由于运动小目标的视感尺寸小且纹理特征模糊,导致现有的传统行人目标检测方法难以应对。针对该问题,基于蝗虫视觉系统的神经结构特性,借助人类大脑内侧颞叶(MTL)情景记忆认知机理,提出一种适用于运动小目标行人检测的人工视觉神经网络(STPDNN)模型。所提出的神经网络包括两部分:突触前和突触后子网络。其中,突触前网络模拟蝗虫视觉系统加工处理视觉信号的神经机理,获得表征目标对象低阶特征的视觉运动线索;突触后网络从低阶视觉信号中提取出行人目标的情景记忆高阶信息,以实现对运动目标的偏好性响应。系统性的实验结果表明,提出的STPDNN可有效检测视觉场景中的运动小目标行人对象。该研究工作涉及生物视神经机理启发的行人目标动态视觉信息加工处理,可为智能视频监控中的行人检测识别与运动行为分析提供新思想、新方法。

    2022年15期 v.58;No.1006 169-183页 [查看摘要][在线阅读][下载 2137K]
    [下载次数:302 ] |[网刊下载次数:0 ] |[引用频次:1 ] |[阅读次数:0 ]
  • 基于ALBERT-UniLM模型的文本自动摘要技术研究

    孙宝山;谭浩;

    任务中的生成式摘要模型对原文理解不充分且容易生成重复文本等问题,提出将词向量模型ALBERT与统一预训练模型UniLM相结合的算法,构造出一种ALBERT-UniLM摘要生成模型。该模型采用预训练动态词向量ALBERT替代传统的BERT基准模型进行特征提取获得词向量。利用融合指针网络的UniLM语言模型对下游生成任务微调,结合覆盖机制来降低重复词的生成并获取摘要文本。实验以ROUGE评测值作为评价指标,在2018年CCF国际自然语言处理与中文计算会议(NLPC-C2018)单文档中文新闻摘要评价数据集上进行验证。与BERT基准模型相比,ALBERT-UniLM模型的Rouge-1、Rouge-2和Rouge-L指标分别提升了1.57%、1.37%和1.60%。实验结果表明,提出的ALBERT-UniLM模型在文本摘要任务上效果明显优于其他基准模型,能够有效提高文本摘要的生成质量。

    2022年15期 v.58;No.1006 184-190页 [查看摘要][在线阅读][下载 1515K]
    [下载次数:1000 ] |[网刊下载次数:0 ] |[引用频次:10 ] |[阅读次数:0 ]
  • MSML-BERT模型的层级多标签文本分类方法研究

    黄伟;刘贵全;

    层级多标签文本分类相比普通的多标签文本分类更具有挑战性,因为文本的多个标签组织成树状的层次结构。当前方法使用相同的模型结构来预测不同层级的标签,忽略了它们之间的差异性和多样性。并且没有充分地建模层级依赖关系,造成各层级标签尤其是下层长尾标签的预测性能差,且会导致标签不一致性问题。为了解决以上问题,将多任务学习架构引入,提出了MSML-BERT模型。该模型将标签结构中每一层的标签分类网络视为一个学习任务,通过任务间知识的共享和传递,提高各层级任务的性能。基于此,设计了多尺度特征抽取模块,用于捕捉不同尺度和粒度的特征以形成不同层级需要的各种知识。进一步,设计了多层级信息传播模块,用于充分建模层级依赖,在不同层级之间传递知识,以帮助下层任务。在该模块中,设计了层次化门控机制,为了过滤不同层级任务之间的知识流动。在RCV1-V2、NYT和WOS数据集上进行了充分的实验,结果显示该模型的总体表现尤其是在下层长尾标签上的表现超过了其他主流模型,并且能维持较低的标签不一致比率。

    2022年15期 v.58;No.1006 191-201页 [查看摘要][在线阅读][下载 1668K]
    [下载次数:1321 ] |[网刊下载次数:0 ] |[引用频次:5 ] |[阅读次数:0 ]
  • 基于时序感知的动态知识图谱补全方法

    李凤英;范伟豪;

    针对动态知识图谱的补全方法大多将时间维度内嵌于实体或关系中,将四元组降维成三元组后以静态知识图谱补全理论进行补全。静态补全方法通常只对实体关系建模,忽略了时间信息在四元组中的重要作用。同时知识库内时间表述存在稀疏性和不规则性。针对以上问题,提出了时序感知编码器和时序卷积解码器。时序感知编码器将时间维度同实体和关系嵌入为同规模向量,通过改进的图卷积神经网络实现四元组的特征提取。针对时序编码器特征提取后的四元组向量,时序卷积解码器利用卷积神经网络评估全局关系以进行链接预测。所提出的方法可以提供更精确的时间维度特征,提升补全时序图谱的性能。在ICEWS14、ICEWS05-15、Wikidata12k和YAGO11k数据集上的实验验证了提出方法的有效性,同时链接预测效果较优。

    2022年15期 v.58;No.1006 202-209页 [查看摘要][在线阅读][下载 1714K]
    [下载次数:1539 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ]
  • 改进LDS_YOLO网络的遥感飞机检测算法研究

    吴杰;高策;余毅;张艳超;裴玉;马少峰;

    为解决遥感飞机检测算法网络计算复杂、检测精度低的问题,以主流网络 YOLOv4为基础,从提高精度和简化模型两个方面进行改进研究,提出一种轻量级多尺度监督网络 LDS_YOLO(light dense supervision YOLO)。针对遥感飞机目标细节信息提取不足的问题,改进三组多尺度融合预测层结构,在每一个支路第一次上采样前的四个卷积块之间设计密集连接方式,可以增强融合不同尺度飞机,丰富特征细节信息,提高预测准确率;针对目标特征关联度低的问题,引入一致性监督损失函数,通过监督分类网络辅助预测的同时提高检测精度;通过增加包含全局平均池化层、全连接层和特征映射层的轻量化模块,调整通道结构减少权重模型的特征冗余,降低网络参数量。在保证检测率的基础上将模型参数量降低为 3.6×10~6,计算量为 77 MFLOPs,测试检测率比原始模型损失不到 2.3%,速度达到 17 frame/s;通过与主流检测算法进行对比,分析轻量化后算法模型的抗过拟合能力和鲁棒性,证明轻量化遥感飞机目标检测算法的有效性和可行性。

    2022年15期 v.58;No.1006 210-219页 [查看摘要][在线阅读][下载 1940K]
    [下载次数:955 ] |[网刊下载次数:0 ] |[引用频次:6 ] |[阅读次数:0 ]

图形图像处理

  • 基于光流残差的视频超分辨率重建算法

    吴昊;赖惠成;钱绪泽;陈豪;

    随着卷积神经网络的发展,视频超分辨率算法取得了显著的成功。因为帧与帧之间的依赖关系比较复杂,所以传统方法缺乏对复杂的依赖关系进行建模的能力,难以对视频超分辨率重建的过程进行精确地运动估计和补偿。因此提出一个基于光流残差的重建网络,在低分辨率空间使用密集残差网络得到相邻视频帧的互补信息,通过金字塔的结构来预测高分辨率视频帧的光流,通过亚像素卷积层将低分辨率的视频帧变成高分辨率视频帧,并将高分辨率的视频帧与预测的高分辨率光流进行运动补偿,将其输入到超分辨率融合网络来得到更好的效果,提出新的损失函数训练网络,能够更好地对网络进行约束。在公开数据集上的实验结果表明,重建效果在峰值信噪比、结构相似度、主观视觉的效果上均有提升。

    2022年15期 v.58;No.1006 220-228页 [查看摘要][在线阅读][下载 3141K]
    [下载次数:310 ] |[网刊下载次数:0 ] |[引用频次:5 ] |[阅读次数:0 ]
  • 基于卷积神经网络模型的医学图像融合

    李雨晨;黄永东;

    提出了一种新的基于卷积神经网络(CNN)和加权最小二乘法(WLS)的医学图像融合算法。算法主要步骤如下:利用滚动导向滤波(RGF)和高斯滤波(GF)构成的混合多尺度分解工具将源图像分解为基础层和一系列细节层,从而能够更好地保留尺度信息和边缘信息。基于卷积神经网络给出基础层融合规则,该规则能够更好地提取图像特征,使融合图像能够很好继承源图像结构信息、能量信息和强度信息。利用绝对值取大规则和加权最小二乘法优化策略,对细节层进行融合,使融合图像中包含更多的视觉细节信息和具有更高对比度。实验结果表明所提算法在视觉评价和客观评价方面与其他算法相比具有较好的优势,且在急性中风、致命性中风和脑膜瘤这三类疾病图像融合效果更为突出。

    2022年15期 v.58;No.1006 229-237页 [查看摘要][在线阅读][下载 1825K]
    [下载次数:813 ] |[网刊下载次数:0 ] |[引用频次:5 ] |[阅读次数:0 ]
  • 基于生成对抗网络的磁共振图像重建

    胥祯浩;沈茜;李霞;

    磁共振成像因具有无辐射、无创伤性,成为临床中最常用的辅助诊断技术之一,但过长的扫描时间和封闭的环境,不仅导致病人产生幽闭恐惧心理,也造成医疗成本的升高。针对此问题,提出了一种以生成对抗网络为核心的磁共振图像重建算法,将U-net网络作为生成器,编码部分使用残差结构以缓解网络退化,并提出空洞金字塔结构,利用空洞卷积的不同扩张率融合不同尺度的上下文信息并添加于解码层之前。判别器中通过一系列卷积实现特征下采样,并利用sigmoid函数完成特征分类,将集成学习的思想融入其中,使重建效果进一步提升。对比已有研究成果和主流重建网络,该模型在10%、20%、30%、50%采样率的测试集中,各项重建指标均排名第一。结果表明,该模型不仅能有效提升磁共振图像重建质量,同时也具有良好的泛化性。

    2022年15期 v.58;No.1006 238-245页 [查看摘要][在线阅读][下载 1784K]
    [下载次数:253 ] |[网刊下载次数:0 ] |[引用频次:2 ] |[阅读次数:0 ]
  • 置信度辅助特征增强的视差估计网络

    柳博谦;刘嘉敏;陈圣伦;王智慧;李豪杰;

    视差估计中由于边缘模糊、遮挡、低光照以及少纹理等干扰因素会产出局部困难估计区域,导致有效匹配减少,估计结果的精度降低。为此,提出了一种置信度辅助特征增强的视差估计网络,在基础的视差估计网络中引入置信度估计子网络,为网络估计过程中间的视差结果计算置信度,利用置信度图可知误差较低的点,增强代价空间中对应位置特征值的幅度,达到辅助特征增强的目的。增强后代价空间可恢复得到更精准的视差。在Scene Flow数据集上训练网络,并和近年来的一些方法进行比较。实验结果表明,该方法优于近年来的经典方法。相比于基础网络,平均误差降低了0.032 9像素;误差大于1像素的比率降低了0.4个百分点。由此可见该方法可以有效提升视差估计网络的性能。

    2022年15期 v.58;No.1006 246-252页 [查看摘要][在线阅读][下载 1571K]
    [下载次数:100 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 融合记忆增强的视频异常检测

    陈澄;胡燕;

    深度自编码器可以通过预测当前帧来判断视频中的异常情况。但由于自动编码器对图片的低层次特征无法良好的预测,在自动编码器中添加跳跃连接可以提高预测图片细节信息的能力。由于自动编码器有很好的“泛化”能力,为了抑制对异常事件的准确预测,通过在编码器和解码器的跳跃连接之间添加记忆增强模块限制模型对异常帧的准确预测。同时,为了突出异常帧中的事件,在预测视频帧的同时通过背景提取模块获取当前图片的背景信息用于后续预测误差的计算。在UCSD Ped2数据集、CUHK Avenue数据集和ShanghaiTech数据集上的实验结果表明,改进后模型的异常检测能力得到了提升。

    2022年15期 v.58;No.1006 253-259页 [查看摘要][在线阅读][下载 1685K]
    [下载次数:297 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ]
  • 改进生成对抗网络在图片数据生成中的应用

    孟辰;曾志高;朱艳辉;朱文球;易胜秋;董丽君;

    图片数据生成旨在根据现有的图片数据,产生与原始图片数据分布相似的图片数据。当前主流的生成对抗网络模型(generative adversarial networks,GAN)产生的图片数据质量较差,模型的训练总是遇到调试困难、训练不稳定、梯度消失、模式崩溃等一系列问题。根据稀疏表达结构和残差结构组合而成的生成器,残差结构组成的辨别器,提出了一种能够生成高质量图片的GAN模型。根据分支网络模型构成的生成器,设计了多种类图片数据生成模型,可以使用一个模型同时训练生成多种类型的图片数据。为了更好地对数据进行训练,设计了一种动态匀速下降学习率,能够根据运行时间对学习率的衰减进行指导。在各个数据集上的实验结果表明,改进模型结构在图像数据生成上比其他算法更加稳定、鲁棒,能够生成更高质量的图片数据。

    2022年15期 v.58;No.1006 260-269页 [查看摘要][在线阅读][下载 1881K]
    [下载次数:480 ] |[网刊下载次数:0 ] |[引用频次:2 ] |[阅读次数:0 ]
  • 基于改进DenseNet的乳腺钼靶肿块分类方法

    白茹;余慧;安建成;曹锐;

    乳腺X线摄影技术是目前乳腺癌早期发现和诊断的重要手段。然而乳腺X线图像中肿块边缘模糊,分类相对困难,因此提升乳腺肿块的诊断精度从而及早预防和治疗仍是医学领域的一大挑战。针对乳腺肿块的特点,提出了一种结合密集卷积神经网络(DenseNet)和压缩激励(SE)模块的新网络(DSAMNet),该网络融合了二者优势,既加强特征重用,又实现特征提取过程中的特征重标定。根据SE模块嵌入DenseNet的不同位置,提出了模型SE-DenseNet-A、SE-DenseNet-B和SE-DenseNet-C。对SE-DenseNet的池化函数进行改进,提出了模型DSAMNet-A、DSAMNet-B和DSAMNet-C。综合不同结构和不同深度的网络模型在公开数据集CBIS-DDSM上进行训练和测试。实验结果表明,DSAMNet-B有更加优异的性能,其准确率比DenseNet模型的准确率提高了10.8%,AUC达到了0.929。

    2022年15期 v.58;No.1006 270-277页 [查看摘要][在线阅读][下载 1607K]
    [下载次数:421 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ]

工程与应用

  • 基于改进CycleGAN的道路场景语义分割研究

    张如涛;黄山;汪鸿浩;

    道路场景下的语义分割是无人驾驶中关键的技术,也是计算机视觉中重要的一个领域,而传统的语义分割方法需要对训练数据进行像素级的标注,对数据的要求极高。针对这一问题,将改进的循环生成对抗网络(cycleconsistent adversarial networks,CycleGAN)用于道路场景语义分割,该网络避免了大量的像素级标注且不需要成对的数据集,降低了数据集的要求。将原网络的目标函数用最小二乘损失和Smooth L1范数替代,增加了网络训练的稳定性且提高了生成图像的质量,并引入特征损失保证图像特征的保留,使得生成图像更加真实。使用道路场景分割中常用的Cityscapes数据集进行实验,并用语义分割领域常用的性能评价指标验证了方法的有效性,实验结果表明相较于原网络各性能都有一定提升。

    2022年15期 v.58;No.1006 278-284页 [查看摘要][在线阅读][下载 1825K]
    [下载次数:673 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ]
  • 基于SGC-LDA模型的财经文本主题研究

    傅魁;鲁冬;覃桂双;

    传统财经领域研究通常关注结构化数据,较少关注非结构化的财经类文本数据,并且财经文本数据蕴含的信息量巨大。针对上述问题,提出SGC-LDA(sliding-window,genetic factor and common financial topic LDA)财经文本主题研究方法。基于通用财经主题的文本噪声过滤建模,以降低噪声数据的影响;基于滑动窗口技术,同时引入财经遗传因子,保证主题的连续性;完成能够实现财经文本主题模型的SGC-LDA算法。基于真实财经文本的实证研究表明,财经文本主题主要由投资理财、民生时事、商业动态、金融市场、宏观经济、产业经济六个主要部分组成;结合财经主题特征词和财经文本对财经主题的扩充,能够更完整准确地描述其财经主题。同时模型本身表现出一定的去噪能力,且与基准模型的对比分析,也证实了所提出模型在财经主题建模方面优越的分类性能和主题连续性。

    2022年15期 v.58;No.1006 285-293页 [查看摘要][在线阅读][下载 1813K]
    [下载次数:569 ] |[网刊下载次数:0 ] |[引用频次:3 ] |[阅读次数:0 ]
  • 考虑用户选择偏好的电动汽车充电站规划研究

    田枫;陈淮莉;

    在国家大力发展新能源汽车的过程中,充电问题一直阻碍着电动汽车的发展,充电基础设施尤其是快速充电站的规划和建设尤为重要。大规模发展电动汽车(electric vehicle,EV)的关键是根据用户的充电选择偏好,建立完善的充电基础设施,减少用户的里程焦虑,彻底解决充电不方便的问题。在考虑了各方面社会因素并确定一定数量的候选节点背景研究的基础上,提出了一种双目标规划模型,在满足需求、距离、容量等约束条件下,分析了建设充电站总成本和充电覆盖范围之间的关系,寻找最优的充电站建设方案,并以A城市B区为例,通过多目标粒子群算法进行求解,求出充电站的最佳节点和数量。用不同算法进行求解,通过对结果进行分析比较,表明多目标粒子群算法(MOPSO)在求解双目标问题时更具有实际意义。

    2022年15期 v.58;No.1006 294-301页 [查看摘要][在线阅读][下载 1447K]
    [下载次数:979 ] |[网刊下载次数:0 ] |[引用频次:12 ] |[阅读次数:0 ]
  • 基于BIM的建筑机器人自主导航策略优化研究

    刘子毅;李铁军;孙晨昭;史家浩;刘今越;

    针对建筑机器人在复杂环境下自主导航过程中的安全性、通过性等问题,提出了一种应用BIM(building information model)信息与激光雷达获取的现实环境信息进行导航并保证路径最优的方法。根据BIM信息优化A*算法,考虑建筑机器人的通过性与安全性并删除了路径中的冗余节点,在节点间根据雷达信息优化动态窗口法,有效保证了路径最优,提升了安全性、缩短了运行时间并减少了转折角度。加入超宽频定位模块,能够很好地消除机器人移动产生的累计误差。实验结果表明,改进后A*算法的搜索时间比改进前减少了92%,路径转折角度减少50%,路径长度比原始动态窗口法减少13.5%,所需时间仅比无障碍物时增加3.7%。

    2022年15期 v.58;No.1006 302-308页 [查看摘要][在线阅读][下载 1645K]
    [下载次数:917 ] |[网刊下载次数:0 ] |[引用频次:15 ] |[阅读次数:0 ]
  • 不确定环境下的危险品运输车辆路径优化

    王琴;杨信丰;李楠;李平;方晟浩;

    针对非满载危险品运输车辆路径优化问题,通过模糊变量刻画运输过程中的人口密度、行驶速度与运输时间以及客户需求量等方面的不确定因素,考虑载货量变化对风险评估的影响,建立基于动态载货量的风险评估模型,以运输总风险、车辆总行程、车辆使用数最小为优化目标,同时兼顾时间窗、事故概率、载货量等约束构建了不确定环境下的危险品运输车辆路径多目标优化模型。将NSGA-Ⅱ算法与LNS算法相结合,设计混合NSGA-Ⅱ算法求解模型。结果表明,混合NSGA-Ⅱ算法可以获得空间分布均匀且收敛性较好的Pareto解集,不同运输参与者可根据自身偏好在解集中选择相应的配送方案;该算法得到的最优总风险、总行程及车辆使用数目分别比NSGA-Ⅱ算法优化了11.5%、1.0%和14.3%,算法搜索性能和求解精度明显提高。

    2022年15期 v.58;No.1006 309-316页 [查看摘要][在线阅读][下载 1526K]
    [下载次数:1253 ] |[网刊下载次数:0 ] |[引用频次:15 ] |[阅读次数:0 ]
  • 基于神经网络和模糊补偿的水下机械臂控制

    高阳;张晓晖;高玉儿;尚婷;杨启航;

    针对水下机械臂动力学模型建模复杂且滑模控制的抖振问题,利用Lagrange法和Morison方程精准建立二连杆串联水下机械臂的动力学模型,对模型中参数的不确定项使用4个RBF神经网络分别进行逼近,并且对摩擦项使用模糊控制进行补偿的方法,精准迅速地实现了对水下机械臂控制系统跟踪控制。通过进行仿真分析,基于神经网络和模糊补偿控制的方法与滑模控制、整体RBF神经网络控制和分块RBF神经网络控制相比,控制系统的平均误差分别降低了85.5%、71.8%、93.1%。结果表明,此方法有效降低了控制系统的跟踪误差,并同时提高了稳态性和抗干扰性。

    2022年15期 v.58;No.1006 317-323页 [查看摘要][在线阅读][下载 1656K]
    [下载次数:857 ] |[网刊下载次数:0 ] |[引用频次:11 ] |[阅读次数:0 ]
  • 基于卷积神经网络的扁桃体咽拭子采样机器人

    李顺君;钱强;史金龙;葛俊彦;茅凌波;

    针对医务人员咽拭子采样时有较高被传染风险,提出咽拭子采样机器人。采样需检测、识别和定位扁桃体的位置信息,由于扁桃体在原图中尺寸较小、特征提取困难,设计基于卷积神经网络的两步检测模型。第一步,使用口腔检测模块将口腔图像从自制的人体面部数据集中检测并切割出来;第二步,在口腔图像基础上,识别位扁桃体的位置信息。结合深度图像计算扁桃体在机器人世界坐标系的坐标,控制机械臂运动到指定位置,实现咽拭子采样。实验证明,系统使用基于卷积神经网络的扁桃体两步检测模型具有较高的准确性和检测效率,检测结果的AP50和检测平均时间均优于对比算法且能够准确地完成咽拭子采样。

    2022年15期 v.58;No.1006 324-329页 [查看摘要][在线阅读][下载 1533K]
    [下载次数:1080 ] |[网刊下载次数:0 ] |[引用频次:4 ] |[阅读次数:0 ]
  • 考虑前置仓协作的两级生鲜配送路径优化研究

    葛显龙;张小晓;王博;

    针对生鲜配送优化研究中存在的易腐烂变质、送达时效性低、物流成本高、车辆载重率低等问题,传统的配送方式难以有效适应生鲜物流,为此提出了前置仓协作的两级配送路径优化策略。考虑生鲜运输的时效性要求,结合冷藏车辆的固定成本、制冷成本、惩罚成本因素,以总成本最低为目标建立数学模型,设计改进遗传算法进行求解,并通过仿真实例验证模型和算法的有效性。结果表明,相比于前置仓传统的独立配送策略,前置仓协作的两级配送策略能够有效地降低配送成本。

    2022年15期 v.58;No.1006 330-340页 [查看摘要][在线阅读][下载 1642K]
    [下载次数:1931 ] |[网刊下载次数:0 ] |[引用频次:14 ] |[阅读次数:0 ]
  • 下载本期数据