计算机工程与应用


热点与综述

  • 视觉可供性研究综述

    李云龙;卿粼波;韩龙玫;王昱晨;

    可供性是指在环境内物体所提供的一系列交互可能,描述环境属性与个体之间的连接过程。其中,视觉可供性研究即通过使用图像、视频等视觉数据,探究视觉主体与环境或物体交互的可能性,涉及到场景识别、动作识别、物体检测等相关领域。视觉可供性可广泛应用于机器人、场景理解等领域。根据目前已有的相关研究,按功能可供性、行为可供性、社交可供性三方面对视觉可供性进行分类,并针对每一类可供性检测方法按照传统机器学习方法和深度学习方法进行详细论述。对当前典型的视觉可供性数据集进行归纳与分析,对视觉可供性的应用方向及未来可能的研究方向进行讨论。

    2022年18期 v.58;No.1009 1-15页 [查看摘要][在线阅读][下载 1737K]
    [下载次数:283 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:8 ]
  • 基于自编码器的深度聚类算法综述

    陶文彬;钱育蓉;张伊扬;马恒志;冷洪勇;马梦楠;

    聚类分析作为一种常见的分析方法,广泛应用于各种场景。随着机器学习技术的发展,深度聚类算法也成了当下研究的热点,基于自编码器的深度聚类算法是其中的代表算法。为了及时了解掌握基于自编码器的深度聚类算法的发展,介绍了四种自编码器的模型,对近些年代表性的算法依照自编码器的结构进行了分类。在MNIST、USPS、Fashion-MNIST数据集上,针对传统聚类算法和基于自编码器的深度聚类算法进行了实验对比、分析,最后对基于自编码器的深度聚类算法目前存在的问题进行了总结,展望了深度聚类算法的研究方向。

    2022年18期 v.58;No.1009 16-25页 [查看摘要][在线阅读][下载 1540K]
    [下载次数:679 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:9 ]
  • 限定域中文事件抽取研究综述

    李华昱;毕经纶;闫阳;

    事件抽取是信息抽取领域最具有挑战性的任务之一,也是知识图谱构建中的关键技术。事件抽取在阅读理解、文本摘要、问答系统等领域得到了广泛的应用。限定域事件抽取指的是系统所抽取的事件类型是预定义的,因此针对某一特定领域,限定域事件抽取的研究更具有研究价值,而且中文事件抽取由于中文语言特性问题,面临着较大挑战。介绍了中文事件抽取中面对的挑战,对限定域中文事件抽取的主要方法进行归纳总结,重点介绍了基于深度学习的方法,并总结了少样本情况下的事件抽取方法,介绍了中文事件抽取常用的数据集,展望了中文事件抽取未来的发展趋势。

    2022年18期 v.58;No.1009 43-58页 [查看摘要][在线阅读][下载 1933K]
    [下载次数:362 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 深度学习在肺结节辅助诊断中的应用

    冯妍妍;魏德健;倪伟;

    肺癌位居癌症死亡率首位,对其进行早期诊断和治疗可降低肺癌患者的死亡率。深度学习能够自动提取结节特征,并完成肺结节的良恶性及恶性等级分类,因此深度学习方法成为肺癌早期诊断的重要手段。对常用数据集进行介绍,系统阐述了栈式去噪自编码器(SDAE)、深度置信网络(DBN)、生成对抗网络(GAN)、卷积神经网络(CNN)、循环神经网络(RNN)和迁移学习技术在肺结节良恶性分类中的应用,阐述了深度卷积生成对抗网络(DCGAN)、多尺度卷积神经网络(MCNN)、U型网络(U-Net)和集成学习技术在肺结节恶性等级分类中的应用,针对肺结节分类的深度学习方法进行了综合分析,并对未来研究方向进行展望。

    2022年18期 v.58;No.1009 59-70页 [查看摘要][在线阅读][下载 1605K]
    [下载次数:336 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 变工况滚动轴承故障诊断方法综述

    胡春生;李国利;赵勇;成芳娟;

    智能制造背景下,旋转机械工况更加复杂,运行条件更加严峻,设备的运行状态监测与故障诊断更加重要。变工况条件下,轴承振动信号存在幅值变、脉动冲击间隔、采样相位不恒定和信号噪声污染等特点,传统滚动轴承故障诊断方法的应用受到了限制。针对变工况条件下的轴承故障诊断技术,发展了以阶次跟踪、时频分析、随机振动以及混沌理论等人工提取特征的信号解调与分析方法、以卷积神经网络、自编码器与深度置信网络为代表的深度学习方法以及迁移学习方法。回顾近五年变工况轴承故障诊断领域的进展,从算法原理、算法优化以及算法实际应用等角度,详细介绍几种当前主流的变工况故障诊断方法,讨论各类算法的优势不足及适用场景,为后续的研究指明方向。

    2022年18期 v.58;No.1009 26-42页 [查看摘要][在线阅读][下载 1549K]
    [下载次数:1192 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]

理论与研发

  • 融合节点标签与强弱关系的链路预测算法

    王曙燕;巩婧怡;

    如何通过已知路径结合相关属性信息和不同关系强度进行链路预测是一个难题。为了解决这个问题,提出融合节点标签与强弱关系的链路预测算法。选取两个中心节点,采用基于双半径节点标签算法计算以其为中心的所有网络节点标签;生成中心节点带有节点标签的h深度局部子图;提取局部子图并将其作为目标网络获得特征矩阵,在对特征矩阵进行矩阵分解的同时融入节点属性信息与强弱关系,赋予动态权值,构建相似度矩阵。实验结果表明,与常见的基于共同邻居算法、基于网络嵌入等链路预测算法相比,该算法的精确度最高提升1.83%,且其预测结果的精确度和效率明显提升,同时能够有效且准确地挖掘各节点的内部相关性。

    2022年18期 v.58;No.1009 71-77页 [查看摘要][在线阅读][下载 1572K]
    [下载次数:213 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 鲁棒最小二乘孪生支持向量机及其稀疏算法

    靳启帆;陈丽;徐明亮;姜晓恒;

    最小二乘孪生支持向量机通过求解两个线性规划问题来代替求解复杂的二次规划问题,具有计算简单和训练速度快的优势。然而,最小二乘孪生支持向量机得到的超平面易受异常点影响且解缺乏稀疏性。针对这一问题,基于截断最小二乘损失提出了一种鲁棒最小二乘孪生支持向量机模型,并从理论上验证了模型对异常点具有鲁棒性。为使模型可处理大规模数据,基于表示定理和不完全Cholesky分解得到了新模型的稀疏解,并提出了适合处理带异常点的大规模数据的稀疏鲁棒最小二乘孪生支持向量机算法。数值实验表明,新算法比已有算法分类准确率、稀疏性、收敛速度分别提高了1.97%~37.7%、26~199倍和6.6~2 027.4倍。

    2022年18期 v.58;No.1009 78-89页 [查看摘要][在线阅读][下载 2602K]
    [下载次数:172 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:9 ]

生成对抗网络专题

  • 生成式对抗网络研究综述

    孙书魁;范菁;曲金帅;路佩东;

    生成式对抗网络(GAN)凭借其强大的对抗学习能力受到越来越多研究者的青睐,并在诸多领域内展现出巨大的潜力。阐述了GAN的发展背景、架构、目标函数,分析了训练过程中出现模式崩溃和梯度消失的原因,并详细介绍了通过架构变化和目标函数修改而提出GAN衍生模型,对一些用来评估生成图像质量和多样性的标准进行了小结,总结了GAN在不同领域的广泛应用,总结全文并对该领域未来的研究方向提出一些展望。

    2022年18期 v.58;No.1009 90-103页 [查看摘要][在线阅读][下载 1779K]
    [下载次数:570 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 基于生成对抗网络的图像动漫风格化

    王一凡;赵乐义;李毅;

    目前的卡通风格图片生成方法仍然存在局限,如色彩不真实、图片局部细节处理不到位等,要想快速将输入图片转换为动漫的风格输出还需要结合深度学习进行研究。基于生成对抗网络的思想,提出了一种动漫风格化编码的生成对抗网络,将输入的图像风格转变为宫崎骏动画电影的风格。网络结构加入自适应实例归一化层(AdaIN)模块和多层感知机(MLP)模块,得到很大优化,同时提高实验效果。在损失函数部分,引入图像感知相似性(lpips)作为内容损失函数,二分类交叉熵(binary cross entropy)损失函数(BCELoss)作为对抗损失函数。实验结果表明,该网络对于动漫化图片起到了很好的效果,FID分数72,能够灵活适用于各种类型的图片动漫化。

    2022年18期 v.58;No.1009 104-110页 [查看摘要][在线阅读][下载 1617K]
    [下载次数:597 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 基于Self-Attention StyleGAN的皮肤癌图像生成与分类

    赵宸;帅仁俊;马力;刘文佳;吴梦麟;

    针对以黑色素瘤为代表的皮肤癌分类任务存在数据集各类样本数量、权重不均衡,且现有的对抗生成网络生成的皮肤癌样本图像质量较差导致临床诊断时难以分辨等问题,提出了一种基于自注意力的样式生成对抗网络(Self-Attention StyleGAN)与SE-ResNeXt-50相结合的皮肤癌图像样本生成与分类框架。该框架在样式生成对抗网络(StyleGAN)的基础上引入了自注意力机制,对生成器的样式控制和噪声输入结构进行了重新设计,并重构了鉴别器对图像生成器进行了调整,从而有效地合成高质量的皮肤癌病变图像。使用SE-ResNeXt-50来对皮肤癌样本图像进行分类,更好地提取样本图像不同层次特征图的信息,从而提高了平衡多类精度(BMA)。实验结果表明,该模型在ISIC2019皮肤癌数据集上生成的样本图像质量较高,且分类BMA达到94.71%。该方法提高了皮肤癌病变图像分类的准确性,帮助皮肤科医生对不同类型的皮肤癌病变进行判断和诊断,并对不同阶段和难以区分的皮肤癌病变进行分析。

    2022年18期 v.58;No.1009 111-121页 [查看摘要][在线阅读][下载 1784K]
    [下载次数:548 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 脸由音生:语音驱动的静动态人脸生成方法

    赵璐璐;陈雁翔;赵鹏铖;朱玉鹏;盛振涛;

    语音驱动人脸生成旨在挖掘语音片段和人脸之间的静动态关联性,进而由给定的语音片段生成对应的人脸图像。然而已有的研究方法大多只考虑其中的一种关联性,且对静态人脸生成的研究严格依赖于时序对齐的音视频数据,在一定程度上限制了静态模型的使用范围。提出了一种基于条件生成对抗网络的语音驱动静动态人脸生成模型(SDVF-GAN)。该模型基于自注意力机制构建语音编码器网络以获得更为准确的听觉特征表达,并将其作为静态生成网络和动态生成网络的输入;静态生成网络利用基于投影层的图像判别器合成出属性一致(年龄、性别)且高质量的静态人脸图像,动态生成网络利用基于注意力思想的嘴唇判别器和图像判别器合成出嘴唇同步的动态人脸序列。实验利用所构建的属性对齐的Voice-Face数据集和公共的LRW数据集分别训练静态人脸生成网络和动态人脸生成网络。结果表明,该模型综合研究了语音和人脸之间的属性对应和嘴唇同步关系,实现了质量更高且关联性和同步性更强的人脸图像生成。

    2022年18期 v.58;No.1009 122-129页 [查看摘要][在线阅读][下载 1528K]
    [下载次数:145 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 基于生成对抗网络的情感对话回复生成

    李凯伟;马力;

    近年来,随着神经网络技术和自然语言处理技术的不断深入发展,基于深度神经网络的对话生成研究取得了突破性的进展,使得人机对话系统广泛应用于生活中,提供便利,比如电商客服、语音助手等。然而,现有的模型倾向于产生一般的回答,普遍缺乏情感因素。针对该问题,提出了一种基于生成对抗网络的情感对话内容生成模型——EC-GAN(emotional conversation generative adversarial network),通过结合多指标奖励与情感编辑约束产生更有意义和可定制的情感回复。对于生成器,使用Seq2Seq模型生成回复,接受判别器的奖励,引导生成句子的回复,提高多样性和情感丰富度;对于判别器,使用双判别器、内容判别器可以确定回复是否属于通用回复,情感判别器判别生成语句的情感与指定的情感类别的一致性,并将判别结果反馈到生成器,指导回复生成。注意观察输入与回复之间的情感变化,验证交互情感的共鸣度存在的方向性。在NLPCC 2017 Shared Task 4——emotional conversation generation的实验表明,模型不仅可以提高回复的流畅性和多样性,同时也显著提高了情感丰富度。

    2022年18期 v.58;No.1009 130-136页 [查看摘要][在线阅读][下载 1457K]
    [下载次数:282 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]

网络、通信与安全

  • 5G异构网络中基于群组的切换认证方案

    张应辉;李一鸣;李怡飞;郑东;

    随着5G网络的发展,各类网络服务质量极大提升的同时网络环境也愈加复杂,从而带来了一系列安全挑战。切换认证可以解决用户在不同类型网络间的接入认证问题,但现存方案仍存在一些不足,还需要解决如全局切换认证、密钥协商、隐私保护、抵抗伪装攻击、抵抗中间人攻击、抵抗重放攻击以及群组用户切换效率等问题。针对这些问题,提出了一个5G异构网络中基于群组的切换认证方案。在所提出的方案中,注册域服务器在区块链上为每个用户存入一个通行证,任何实体都可以利用该通行证对用户进行认证,从而实现全局切换认证。对于群组用户,各用户分别设置可聚合的认证参数,验证者通过验证聚合签名实现对群组用户的批量验证。新方案不仅提升了群组用户切换时的效率,同时还满足上述安全性要求。基于形式化分析软件AVISPA的分析结果表明,所提出的方案是安全的。性能分析表明,所提出的方案执行批量验证时的效率比现存方案至少提升了89.8%。

    2022年18期 v.58;No.1009 137-146页 [查看摘要][在线阅读][下载 1873K]
    [下载次数:363 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 基于LSTM和动态策略的定向灰盒模糊测试技术

    李兆基;王田原;周自强;王尧;陈永乐;

    定向模糊测试旨在快速生产测试用例,达到给定的程序目标位置区域并发现程序错误。但目前的定向模糊测试工具普遍存在测试效率较低的问题,为此提出了一种基于神经网络的定向灰盒模糊测试方法,通过学习过去的模糊探索输入文件中不同位置的变异模式以生成模型来预测当前种子能够产生输入增益的位置,从而指导模糊器进行优化突变。同时为了解决定向灰盒模糊器中探索与开发的权衡问题,引入了一种动态策略在模糊测试过程中自适应协调两个阶段。基于现有的模糊测试框架AFL实现了一个原型系统,命名为DYNFuzz,并在3个基准上对其进行了测试和评估,实验结果表明,DYNFuzz具有比其他模糊器更高的定向性能和测试效率,并且不会陷入由探索开发不平衡导致的局部困境。

    2022年18期 v.58;No.1009 147-153页 [查看摘要][在线阅读][下载 1539K]
    [下载次数:215 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]

模式识别与人工智能

  • 癌症多组学数据深度自编码器整合分型方法

    曹业伟;刘飞;

    在癌症研究中,随着高通量测序技术发展已经产生了海量的复杂数据。尽管有了一些利用深度学习和统计学方法进行多组学数据整合的研究,但目前仍缺乏较为有效率的整合方法。因此提出一种基于深度自编码器的多组学数据整合方法(deep autoencoder for multi-omics integration,DAEMI)。它利用自编码器中的瓶颈层,学习多组学数据的特征表示。与先前利用深度学习整合的研究相比,DAEMI可以发现明显生存差异的癌症亚型。同时因为不需要生存数据来选择特征,DAEMI可以使用更多特征进行K均值聚类,进而完成癌症分型任务。将DAEMI应用于模拟数据集与四个癌症数据集实验,通过与高阶路径相似度网络的融合模型(HOPES)、相似性网络融合(SNF)、iClusterPlus和moCluster进行比较,结合模拟数据集测试结果与真实癌症数据集测试结果来看,DAEMI要优于其他方法。相应的生物功能分析揭示,神经退行性疾病与线粒体功能障碍可能与癌症共享某些生物学通路。

    2022年18期 v.58;No.1009 154-161页 [查看摘要][在线阅读][下载 1875K]
    [下载次数:280 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 结合柯西核的分类型数据密度峰值聚类算法

    盛锦超;杜明晶;李宇蕊;孙嘉睿;

    密度峰值聚类算法在处理分类型数据时难以产生较好的聚类效果。针对该现象,详细分析了其产生的原因:距离计算的重叠问题和密度计算的聚集问题。同时为了解决上述问题,提出了一种面向分类型数据的密度峰值聚类算法(Cauchy kernel-based density peaks clustering for categorical data,CDPCD)。算法首先指出分类型数据距离度量过程中有序特性(分类型数据属性值之间的顺序关系)鲜有考虑的现状,进而提出一种基于概率分布的加权有序距离度量来缓解重叠问题。通过结合柯西核函数,在共享最近邻密度峰值聚类算法基础上重新评估数据密度值,改进了密度计算和二次分配方式,增强了密度多样性,降低了聚集问题带来的影响。多个真实数据集上的实验结果表明,相较于传统的基于划分和密度的聚类算法,CDPCD都取得了更好的聚类结果。

    2022年18期 v.58;No.1009 162-171页 [查看摘要][在线阅读][下载 1662K]
    [下载次数:238 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 面向小目标检测的并行高分辨率网络设计

    牛润;曲毅;郑乐辉;魏建国;

    当前目标检测算法对小目标检测存在特征信息易丢失的问题,利用网络处理高分辨率特征图数据可以缓解,但存在语义信息不足和计算负担大的缺点。为弥补这些缺点,提出一种有效处理高分辨率特征图、多深度子网并行连接的特征提取网络。构建输入图像金字塔,搭建多深度分支子网并行连接的结构,使用浅层网络处理图像金字塔中高分辨率特征图,深层网络处理低分辨率特征图,多分支同时运行并在中间位置进行两次特征融合,充分结合高分辨率特征信息和低分辨率语义信息;使用融合因子构建对小目标针对性强的多尺度特征融合结构,增强对小目标检测能力;使用注意力机制进一步提高特征提取能力。在公开数据集AI-TOD上进行实验表明,所设计的特征提取网络相较于其他常用特征提取网络对小目标的检测能力更强,在two-stage经典模型Faster-RCNN、one-stage经典模型SSD、YOLOv3以及anchor-free经典模型CenterNet上替换上原主干网络,检测平均精度mAP与原来相比分别提升了2.7、3.4、3.3、1.7个百分点,证明了所提网络结构的适用性和有效性。

    2022年18期 v.58;No.1009 172-179页 [查看摘要][在线阅读][下载 2208K]
    [下载次数:249 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 结合轻量Openpose和注意力引导图卷积的动作识别

    张富凯;贺天成;

    现有人体姿态动作识别方法忽视前期姿态估计算法的作用,没有充分提取动作特征,提出一种结合轻量级Openpose和注意力引导图卷积网络的动作识别方法。该方法包含基于shufflenet的Openpose算法和基于不同尺度邻接矩阵注意力的图卷积算法。输入视频由轻量Openpose处理得到18个人体关键点信息,表达为基础时空图数据形式。节点的不同尺度邻居信息对应的邻接矩阵通过自注意力机制计算影响力,将各尺度邻接矩阵加权合并输入图卷积网络提取特征。提取到的鉴别特征通过全局平均池化和softmax分类器输出动作类别。在Le2i Fall Detection数据集和自定义的UR-KTH数据集上的实验表明,动作识别的准确率分别为95.52%和95.07%,达到了预期效果。

    2022年18期 v.58;No.1009 180-187页 [查看摘要][在线阅读][下载 1630K]
    [下载次数:697 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 面向多目标跟踪系统的专用循环目标检测器

    牛嘉丰;石蕴玉;刘翔;贺桢;戴佩哲;

    多目标跟踪技术在视频分析、信号处理等领域有着广泛的应用。在现代多目标跟踪系统通常遵循的“按检测跟踪”模式中,目标检测器的性能决定了多目标跟踪任务的跟踪精度和速度。为提高多目标跟踪系统跟踪性能,提出了面向多目标跟踪系统的专用循环目标检测器,它利用视频帧序列间高度相似性的特点,依据先前帧的目标位置信息和当前帧相对于先前帧的变化得分图来选取候选框,解决了传统二阶段目标检测器中使用候选框推荐网络带来的参数量和计算量大的问题,同时融合了目标外观特征提取分支,进一步减少了多目标跟踪系统整体运行时间。实验表明,专用循环目标检测器及其他最先进的检测器分别应用于多目标跟踪系统,采用专用循环目标检测器时能够在保证多目标跟踪系统跟踪精度的情况下提升跟踪速度。

    2022年18期 v.58;No.1009 188-194页 [查看摘要][在线阅读][下载 1567K]
    [下载次数:73 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 融合多聚类信息的无监督行人重识别算法

    苏荻翔;王帮海;叶子成;

    在无监督的行人重识别领域中,始终很难对数据集中的难样本对进行很好的挖掘。针对这个问题,提出了融合多种聚类信息生成软多重标签并进行难样本对挖掘的方法。该方法基于不同聚类方法使用的聚类机制不同这一原理,发掘类内样本的共通性与类间样本的差异性,进而使模型能够学习到更有区分性的特征。在Market-1501数据集与DukeMTMC-reID数据集上进行的对比实验结果表明,提出的方法在原来初步学习的网络的基础上,mAP分别提高了14.4%与8.9%,精度均提高显著。

    2022年18期 v.58;No.1009 195-204页 [查看摘要][在线阅读][下载 2916K]
    [下载次数:499 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 类肤色背景下的人脸追踪改进算法

    解梦达;孙鹏;张志豪;郎宇博;周纯冰;单大国;

    针对人脸追踪过程中,基于目标色彩特征的CamShift(continuously adaptive mean-shift)算法受类肤色背景干扰所导致的搜索框偏移及尺寸异常问题,提出了一种结合肤色分割及追踪监测机制的人脸追踪改进算法。在YCbCr色彩空间的Cb、Cr分量内采用非参数肤色分割模型及SVM(support vector machines)构建特定于当前视频序列的联合肤色分割模型,以由粗至细的方式去除视频帧中类肤色背景。随后,在Cr分量内构建CamShift算法色彩直方图并进行人脸追踪。考虑在追踪过程中,当场景或光照强度改变时易出现的联合肤色分割模型及CamShift算法色彩直方图失效问题,采用拉依达准则(pauta criterion)判断追踪窗口内Cr分量均值的异常,当监测到异常值时即判定当前视频帧人脸追踪失败,使用Adaboost(adaptive boosting)算法构建的人脸检测器进行人脸复检并重构CamShift算法色彩直方图及联合肤色分割模型。在OTB-2015目标追踪数据集中进行测试,实验结果表明,所提算法在类肤色背景下相比原始CamShift算法对人脸目标的追踪精度更高;相比近几年的追踪算法则在具有良好追踪精度的同时速度优势明显。

    2022年18期 v.58;No.1009 205-217页 [查看摘要][在线阅读][下载 2358K]
    [下载次数:259 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 面向时钟领域的BERT-LCRF命名实体识别方法

    唐焕玲;王慧;隗昊;赵红磊;窦全胜;鲁明羽;

    命名实体识别是构建时钟领域知识图谱的关键步骤,然而目前时钟领域存在标注样本数量少等问题,导致面向时钟领域的命名实体识别精度不高。为此,利用预训练语言模型BERT进行时钟领域文本的特征提取,利用线性链条件随机场(Linear-CRF)方法进行序列标注,提出了一种BERT-LCRF的命名实体识别模型。对比实验结果表明,该模型能够充分学习时钟领域的特征信息,提升序列标注精度,进而提升时钟领域的命名实体识别效果。

    2022年18期 v.58;No.1009 218-226页 [查看摘要][在线阅读][下载 1450K]
    [下载次数:497 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 结合gazetteers和句法依存树的中文命名实体识别

    方红;苏铭;冯一铂;张澜;

    中文命名实体识别在机器翻译、智能问答等下游任务中起着重要作用。提出一种新的基于gazetteers和句法依存树的中文命名实体识别方法,旨在解决由于字符向量缺少词信息和词之间的句法依赖结构信息而导致的错误传递问题。该方法将句子中的gazetteers信息和句法依存树信息形成图,再通过自适应门控图神经网络(adapted gated graph neural networks,AGGNN)将其融入到字符向量中,从而使得每个字向量很好地获取词汇间的语义关系,提升识别准确率。通过在Ecommerce、Resume、QI等数据集的验证,新的方法可以使得中文实体识别的准确率得到较大提升。

    2022年18期 v.58;No.1009 227-232页 [查看摘要][在线阅读][下载 1379K]
    [下载次数:221 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 语义及句法特征多注意力交互的医疗自动问答

    张华丽;康晓东;李小军;刘汉卿;王笑天;

    针对中文医疗自动问答任务,为了捕捉问答句中重要的句法信息和语义信息,提出引入图卷积神经网络捕捉句法信息,并添加多注意力池化模块实现问答句的语序特征和句法特征联合学习的方法。在BERT模型学习问答句的高阶语义特征基础上,利用双向门控循环单元描述句子的全局语义特征,以及引入图卷积神经网络编码句子的语法结构信息,以与双向门控循环单元所获取的序列特征呈现互补关系;通过多注意力池化模块对问答对的不同语义空间上的编码向量进行两两交互,并着重突出问答对的共现特征;通过衡量问答对的匹配分数,找出最佳答案。实验结果表明,在cMedQA v1.0和cMedQA v2.0数据集上,相比于主流的深度学习方法,所提方法的ACC@1有所提高。实验证明引入图卷积神经网络和多注意力池化模块的集成算法能有效提升自动问答模型的性能。

    2022年18期 v.58;No.1009 233-240页 [查看摘要][在线阅读][下载 1493K]
    [下载次数:217 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:7 ]

图形图像处理

  • 基于自注意力深度哈希的海量指纹索引方法

    吴元春;赵彤;

    现有的指纹索引方法大多是基于实数值特征向量,当应用于大规模指纹库时无法避免计算资源与存储空间消耗巨大的问题。为了在海量指纹库中进行高效快速检索并得到实时响应结果,提出了一种全新的基于有监督深度哈希的指纹索引方法。将传统指纹领域知识与自注意力深度哈希模型相结合。传统领域知识用于指纹图像预处理来获取指纹二值骨架图,自注意力深度哈希模型进行特征提取与哈希映射得到二进制编码。其中特征提取模块使用Transformer结构替换卷积神经网络来提取指纹细节特征,此外模型中加入了自动对齐模块并设计了一种STN-AE的结构来辅助训练该模块。最后在NIST4、NIST14、FVC2000、FVC2002、FVC2004等公开指纹数据集上进行了实验,实验结果证实该方法在提高海量指纹库中的检索速度以及降低存储消耗等方面是卓有成效的。

    2022年18期 v.58;No.1009 241-250页 [查看摘要][在线阅读][下载 2133K]
    [下载次数:167 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 半结构化环境稀疏点云可通行区域检测方法

    洪洋;袁夏;高飞;成诚;杨欢;陈耀忠;陆建峰;

    传统的激光雷达可通行区域检测算法实时性好,但算法通常对点云数据的高度特征依赖较强,半结构化环境中斜坡等区域高度特征不稳定,易降低算法的性能。基于半结构化环境下三维稀疏点云数据,提出了一种基于直线特征的可通行区域实时检测算法,预处理原始点云数据,并从中速提取直线特征;对直线聚类和筛选,从而提取有效的直线特征;使用直线特征检测结构化障碍物和非结构化障碍物;标记出可通行区域,并构建环境地图。实验结果表明,在校园半结构化环境中,该算法可以较稳定地检测可通行区域,在检测路缘石等高度较低的障碍物时表现出良好的性能,并且适应斜坡、颠簸、负障碍等地面。

    2022年18期 v.58;No.1009 251-259页 [查看摘要][在线阅读][下载 2046K]
    [下载次数:195 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 基于分流的高光谱遥感图像超分辨重建

    徐英豪;吕玉超;刘斯凡;朱习军;

    高光谱图像(hyperspectral image,HSI)每个像素包含大量光谱带,而HSI的空间分辨率较低。高光谱图像超分辨率技术可以有效提高空间分辨率。为了解决高光谱遥感图像的空间信息分布不均匀,超分辨率重建时占据相同计算量导致重建工作不够细化的问题,提出了一种多层级分流和细节增强的高光谱遥感图像超分辨率重建框架。即通过子图分流网络对高光谱遥感图像进行预先分流,改进带细节增强的多尺度Retinex算法对图像的高低频信息进行分离,再使用不同复杂程度的分支网络分别进行重建,重建工作更加细化具体,提高重建效果和性能。实验证明该方法可以在视觉质量、指标测量和分类应用方面优于传统的基于CNN的方法,在SRE和MPSNR指标方面分别提高了4.18%和9.35%。

    2022年18期 v.58;No.1009 260-267页 [查看摘要][在线阅读][下载 1557K]
    [下载次数:303 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 基于多级特征融合的伪装目标分割

    付炳阳;曹铁勇;郑云飞;方正;王杨;王烨奎;

    在伪装目标分割任务中,如何提取深度模型下高分辨率的目标语义特征是构建目标分割模型的关键。针对此问题,提出了一种基于多级特征融合的伪装目标分割方法。在特征编码过程中,引入多级门控模块对Res2Net-50的多级中间层特征进行选择性融合,有效过滤各级特征图的干扰信息;在解码过程中,通过自交互残差模块驱动不同尺度的编码特征实现交叉融合,获得更准确的目标表示信息。此外,在交叉熵损失的基础上加入Dice损失形成联合损失函数,帮助模型更精准地分割伪装目标。实验结果证明,在背景复杂的迷彩伪装数据集以及三个常用自然伪装数据集上,相比其他典型模型,该模型表现出更好的分割效果。

    2022年18期 v.58;No.1009 268-276页 [查看摘要][在线阅读][下载 1948K]
    [下载次数:176 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:7 ]
  • 双回归网络的单图像超分辨率重建

    张永;吕庚;

    现有基于卷积神经网络的单图像超分辨率模型存在三个限制。理论上存在无限的HR图像,可以下采样到相同的LR图像,可能的函数空间非常大。因为现实世界潜在的下采样方法是未知的,使用特定方法配对的数据训练的模型在实际应用中泛化能力差,产生适应性问题。忽视残差分支的高频层次特征。针对上述问题,提出双重回归方案。除了学习从LR到HR图像的原始回归映射之外,额外学习一个对偶回归映射来估计下采样核并重建LR图像,形成一个闭环提供额外的监督,并在残差结构上引入了傅里叶变换,增强模型对高频信息的表达能力。相比其他先进模型以更少的参数重建HR图像,且拥有丰富的高频纹理细节。

    2022年18期 v.58;No.1009 277-283页 [查看摘要][在线阅读][下载 1813K]
    [下载次数:173 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]

工程与应用

  • 旅游领域实体和关系联合抽取方法研究

    陈赟;古丽拉·阿东别克;马雅静;

    从文本信息中抽取关系三元组是构建知识图谱的关键任务,近年来受到工业界和学术界的广泛关注。针对旅游领域信息抽取过程中出现的实体嵌套和关系重叠问题,提出了一种基于双仿射注意力机制的实体关系联合抽取模型BAMRel,该模型通过共享编码层参数利用双仿射注意力机制在实体识别部分和关系抽取部分构建分类矩阵,并在关系抽取部分融合实体类型信息,提升关系抽取效果的同时增加了两个任务之间的交互。此外,通过远程监督和人工校验构建了旅游领域关系抽取数据集TFRED,BAMRel模型在此数据集上F1值达到了91.8%,有效地解决了实体嵌套和关系重叠问题。为了验证模型的鲁棒性,在百度DuIE数据集上与主流联合抽取模型进行了对比实验,BAMRel模型取得了最高的F1值80.2%。

    2022年18期 v.58;No.1009 284-296页 [查看摘要][在线阅读][下载 1737K]
    [下载次数:557 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 过必经点集且具有额外硬约束的最短路径算法

    郭展羽;张志明;贺兰山;郑家齐;赵师兵;康琦;

    求解过必经点集的最短路径问题已有多种算法,但其应用到在具有额外硬约束限定条件的场景时存在不足。针对此类问题,提出一种基于深度优先搜索发展的随机搜索算法,由使用者依据现场情况给出数学描述,建模抽象为无向带权图表示;依据路径规划要求定义相关变量,包括路径规划的起点、终点、必经点集以及额外硬约束条件,图信息和节点信息以邻接矩阵的形式保存;搜索过程中对路径的可行性加入额外硬约束条件进行实时判定,最终获得最短路径解。实验仿真和实测结果表明,该算法能有效规避额外硬约束条件下的中间路径,生成合理的最短路径,改善相关问题的可求解性。

    2022年18期 v.58;No.1009 297-303页 [查看摘要][在线阅读][下载 1525K]
    [下载次数:556 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 面向大学课程时间表的并行多视图搜索算法

    宋婷;王栋;许玉龙;王昂;

    针对大学课程时间表问题,提出一种基于改进迭代局部搜索的并行多视图搜索算法进行求解。依据课程时间表问题特性设计包含八种基础邻域的多邻域集,并根据提升速度比制定基邻域选择概率设置规则。在迭代局部搜索过程中,运用多视图学习策略对多个局部搜索步骤进行视图共享,及时调整搜索方向以提升搜索效率。通过并行计算思想对算法优化,提升多视图搜索的收敛速度。实验结果表明,提出的算法求解精度更佳,且具有优异的扩展性和并行效率。

    2022年18期 v.58;No.1009 304-310页 [查看摘要][在线阅读][下载 1563K]
    [下载次数:68 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 融合环境信息和运动约束的改进A*算法研究

    白雄;鲁吉林;路宽;陈鹏云;崔俊杰;刘泽华;

    标准A*算法存在着无法考虑移动机器人运动特性及处理后的路径不利于移动机器人运动等问题。针对这一问题提出了一种新改进A*算法,通过环境信息引入障碍物权重系数来改进算法的启发函数并进行全局路径规划;优化搜索节点的选取方式和设定障碍物与路径之间的安全距离;基于对移动机器人的运动特性的考虑优化其路径,并在不同环境地图中与其他算法进行仿真实验对比分析。相关实验表明:基于新改进A*算法规划的路径始终与障碍物保持一定的安全距离;改进A*算法在时间上相比标准A*算法平均减少了80%,路径长度平均减少了2%,路径转角平均降低了82%。改进后算法相比其他算法在时间、搜索节点以及平滑度上有很大的改进,融合机器人环境信息和运动特性的规划路径算法可为移动机器人的路径规划提供一种新的方法。

    2022年18期 v.58;No.1009 311-317页 [查看摘要][在线阅读][下载 1998K]
    [下载次数:289 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • Mask R-CNN模型在茄花花期识别中的应用研究

    郑凯;方春;袁思邈;冯创;李国坤;

    将Mask R-CNN实例分割模型应用于茄子花期识别研究,针对Mask R-CNN模型对大目标物存在误检和漏检的情况,提出使用混合空洞卷积融合普通卷积的方法,在ResNet50的残差块中进行参数修改,通过堆叠残差块完成对整个特征提取网络的改进,扩大了特征图感受野,增强了全局信息关联性;针对出现的过拟合问题,运用迁移学习方法将预训练的ResNet50特征提取网络作为茄花识别模型的初始参数,提高了模型在测试集泛化能力的同时提升了模型训练速度。运用改进的模型在测试集上的mAP为0.962,mIOU为0.715。通过定性分析并与其他模型进行对比,证明改进的模型能有效提高大目标物分割能力,对茄子花期识别具有良好效果。该研究为茄花自动授粉与花期管理提供了技术支持,对保证授粉质量,提升经济效益具有重要意义。

    2022年18期 v.58;No.1009 318-326页 [查看摘要][在线阅读][下载 1949K]
    [下载次数:346 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:5 ]
  • 异构集群节点与作业特性感知资源分配算法

    胡亚红;吴寅超;朱正东;李小轩;

    为了避免多应用间的资源争用,Spark采用了FIFO、FAIR等作业调度策略,辅以SpreadOut和非SpreadOut两种资源调度算法,但是这些算法没有充分考虑用户作业类型和集群节点性能的相互关系。用户作业类型及节点性能偏向感知的资源调度算法ATNPA提出了对该问题的解决方案。ATNPA根据作业运行所需的内存量和CPU核数将用户作业分为CPU密集型和内存密集型。节点的性能偏向性由节点的静态因素和动态因素决定。静态因素包括CPU速度、内存大小、CPU核数和磁盘容量等;动态因素包括CPU剩余率、内存剩余率、磁盘剩余率和磁盘读写速度等。ATNPA算法在进行资源分配时,能够将作业分配到最适合其类型的节点上。仿真实验表明,与未考虑节点和作业匹配的算法相比较,ATNPA能够有效缩短作业的执行时间、提高集群的性能。

    2022年18期 v.58;No.1009 327-334页 [查看摘要][在线阅读][下载 1546K]
    [下载次数:279 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:6 ]
  • 下载本期数据