计算机工程与应用


热点与综述

  • 弱监督显著性目标检测研究进展

    于俊伟;郭园森;张自豪;母亚双;

    显著性目标检测旨在准确检测和定位图像或视频中最引人注目的目标或区域,为更好地进行目标识别和场景分析提供帮助。尽管全监督显著性检测方法取得一定成效,但获取大规模像素级标注数据集十分困难且昂贵。弱监督检测方法利用相对容易获取的图像级标签或带噪声的弱标签训练模型,在实际应用中表现出良好效果。全面对比了全监督和弱监督显著性检测的主流方法和应用场景,重点分析了常用的弱标签数据标注方法及其对显著目标检测的影响。综述了弱监督条件下显著目标检测方法的最新研究进展,并在常用数据集上对不同弱监督方法的性能进行了比较。最后探讨了弱监督显著性检测在农业、医学和军事等特殊领域的应用前景,指出了该研究领域存在的问题及未来发展趋势。

    2024年10期 v.60;No.1049 1-15页 [查看摘要][在线阅读][下载 1970K]
    [下载次数:340 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 智能建造机器人局部路径规划研究综述

    于军琪;陈易圣;冯春勇;苏煜聪;郭聚刚;

    智能建造机器人作为落实建筑业智能化转型的关键设备,其自主施工能力代表着智能建造的水平,而局部路径规划是机器人高效施工的关键技术。针对建筑施工现场的环境特点,探究了智能建造机器人局部路径规划的难点。首先分析阐述了人工势场、时间弹性带、Bug、动态窗口等经典局部路径规划算法;其次对强化学习、深度强化学习、模糊控制、群智能等人工智能的局部路径规划算法进行了归纳总结;最后分析了各种方法在施工现场环境中智能建造机器人应用的局限性,讨论了智能建造机器人局部路径规划算法的发展趋势,旨在为复杂施工现场智能建造机器人局部路径规划研究提供一定的思路和建议,提高机器人的自主施工能力,促进智能建造技术的发展。

    2024年10期 v.60;No.1049 16-29页 [查看摘要][在线阅读][下载 1787K]
    [下载次数:2528 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 细粒度图像分类上Vision Transformer的发展综述

    孙露露;刘建平;王健;邢嘉璐;张越;王晨阳;

    细粒度图像分类(fine-grained image classification,FGIC)一直是计算机视觉领域中的重要问题。与传统图像分类任务相比,FGIC的挑战在于类间对象极其相似,使任务难度进一步增加。随着深度学习的发展,Vision Transformer(ViT)模型在视觉领域掀起热潮,并被引入到FGIC任务中。介绍了FGIC任务所面临的挑战,分析了ViT模型及其特性。主要根据模型结构全面综述了基于ViT的FGIC算法,包括特征提取、特征关系构建、特征注意和特征增强四方面内容,对每种算法进行了总结,并分析了它们的优缺点。通过对不同ViT模型在相同公用数据集上进行模型性能比较,以验证它们在FGIC任务上的有效性。最后指出了目前研究的不足,并提出未来研究方向,以进一步探索ViT在FGIC中的潜力。

    2024年10期 v.60;No.1049 30-46页 [查看摘要][在线阅读][下载 2048K]
    [下载次数:1189 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 推荐系统中神经网络结合注意力机制研究综述

    高广尚;

    探讨神经网络如何结合注意力机制及其变种,以更好地学习用户和物品间复杂和隐含的关系,从而提高推荐的准确性和个性化水平。从多层感知机、卷积神经网络、循环神经网络、自编码器、图神经网络以及反向传播神经网络这六类典型神经网络出发,研究它们与注意力机制相结合进行推荐的过程,具体结合点击率预测、标签推荐和评论评分预测等典型应用场景进行优缺点分析。通过将神经网络与注意力机制相结合,模型能够聚焦于输入数据中的关键信息,降低对次要信息的注意程度,甚至直接过滤掉无关信息。现有将注意力机制与神经网络结合的推荐模型,在很大程度上能够满足常见的推荐任务需求。但是这类模型在跨域推荐、深度强化学习推荐以及多模态推荐等复杂推荐场景中,仍面临一些挑战,例如跨域推荐需要模型具备迁移学习的能力,强化学习推荐需要进行长期奖励建模。

    2024年10期 v.60;No.1049 47-60页 [查看摘要][在线阅读][下载 1627K]
    [下载次数:1636 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 针对目标检测模型的物理对抗攻击综述

    蔡伟;狄星雨;蒋昕昊;王鑫;高蔚洁;

    深度学习模型容易受到对抗样本的影响,在图像上添加肉眼不可见的微小扰动就可以使训练有素的深度学习模型失灵。最近的研究表明这种扰动也存在于现实世界中。聚焦于深度学习目标检测模型的物理对抗攻击,明确了物理对抗攻击的概念,并介绍了目标检测物理对抗攻击的一般流程,依据攻击任务的不同,从车辆检测和行人检测两个方面综述了近年来一系列针对目标检测网络的物理对抗攻击方法,简单介绍了其他针对目标检测模型的攻击、其他攻击任务和其他攻击方式。最后讨论了物理对抗攻击当前面临的挑战,引出了对抗训练的局限性,并展望了未来可能的发展方向和应用前景。

    2024年10期 v.60;No.1049 61-75页 [查看摘要][在线阅读][下载 2458K]
    [下载次数:497 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]

理论与研发

  • 求解约束优化问题的改进蛇优化算法

    梁昔明;史兰艳;龙文;

    结合外点罚函数法与改进蛇优化算法求解约束优化问题,得到一种新的求解约束优化问题的算法WDFSO。算法WDFSO首先通过外点罚函数法将约束优化问题转化为一系列界约束优化问题,然后运用基于变异质心的对立学习策略与种群分类策略改进的蛇优化算法对所得界约束优化问题进行求解,进而获得所求约束优化问题的解。为验证算法WDFSO的有效性,选取CEC2006中19个标准约束优化问题进行数值实验,并使用Wilcoxon秩和检验来证明算法的显著性。实验结果表明,与对比算法相比,算法WDFSO求解约束优化问题具有更高的收敛精度和更好的稳定性。最后应用算法WDFSO求解两个工程约束优化问题,结果表明算法WDFSO求解性能更好。

    2024年10期 v.60;No.1049 76-87页 [查看摘要][在线阅读][下载 1789K]
    [下载次数:401 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 融入小生境和混合变异策略的鲸鱼优化算法

    于涛;高岳林;

    鲸鱼优化算法作为一种结构简单的先进优化算法,被用于解决各类学科问题。通过对鲸鱼优化算法进行深入研究,发现该算法存在收敛速度慢、无法跳出局部最优、收敛精度低以及无法平衡全局勘探与局部开发能力等问题。为解决上述问题,提出一种融入小生境和混合变异策略的鲸鱼优化算法(whale optimization algorithm integrating niche and hybrid mutation strategy,NHWOA)。该算法通过引入自适应权重,平衡算法全局勘探与局部开发能力,并加快收敛速度;将种群按照相同规模划分成三个小生境并独立寻优,提高种群多样性;采用混合变异策略对种群进行随机扰动,帮助算法跳出局部最优。通过在CEC2017测试套件上对NHWOA进行仿真实验,并将其应用于特征选择问题,验证了NHWOA的先进性和有效性。NHWOA的收敛速度更快,收敛精度更高,并且鲁棒性更好。

    2024年10期 v.60;No.1049 88-104页 [查看摘要][在线阅读][下载 2544K]
    [下载次数:599 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]

模式识别与人工智能

  • 深层次标签辅助分类任务的层次标签文本分类方法

    曹渝昆;魏子越;唐艺嘉;金成坤;李云峰;

    层次标签文本分类是自然语言处理领域中一项具有挑战性的任务,每个文档需要被正确分类到对应具有层次结构的多个标签中。然而在标签集中,由于标签包含的语义信息不充分,同时被归类到深层次标签的文档数量过少,深层次标签训练不充分,导致显著的标签训练不平衡问题。基于此,提出了深层次标签辅助分类任务的层次标签文本分类方法(DLAC)。该方法提出了一种深层次标签辅助分类器,在标签语义增强的基础上有效利用文本特征与深层次标签对应的父标签结点(即浅层次标签的丰富特征)来提升深层次标签的分类性能。与11种算法在三个数据集上的对比实验结果表明,模型能够有效提升深层次标签的分类性能,并取得良好效果。

    2024年10期 v.60;No.1049 105-112页 [查看摘要][在线阅读][下载 1834K]
    [下载次数:258 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 基于条件独立性检验的非稳态因果发现方法

    郝志峰;张维杰;蔡瑞初;陈薇;

    非稳态时间序列数据之间的因果关系发现是非常重要但极具挑战的问题。现有的工作主要假设观察数据随着时间或领域发生变化。上述假设使得相关方法需要引入时间或领域作为先验知识,无法应用于分段稳态的非稳态场景。因此,提出了一种基于条件独立性检验的非稳态因果关系发现算法。首先使用变化点检测方法来识别非稳态变化的时间点,然后将上一步的时间点进行区间划分,用基于条件独立性检验的时序因果关系发现算法推断局部稳态因果结构。在仿真和真实世界数据上的实验证明了该方法的有效性。

    2024年10期 v.60;No.1049 113-120页 [查看摘要][在线阅读][下载 2102K]
    [下载次数:216 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 两阶段问答范式的生物医学事件触发词检测

    行帅;熊玉洁;苏前敏;黄继汉;

    现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识别阶段,采用基于句法距离的注意力捕获更有意义的上下文特征,排除无关信息的干扰;为了有效利用实体中的潜在特征,采用全局统计的单词-实体-事件共现特征,指导事件类型感知注意力挖掘词与事件之间的强关联性。在触发词定位阶段,根据识别出的事件类型,制定问题回答该事件对应的触发词索引,从而利用丰富的问答数据库实现数据增强。在MLEE语料库上的结果表明,两阶段问答范式、句法距离和事件类型感知注意力都有效地提升了模型性能,所提出的模型取得了81.39%的F1分数,并在多个事件类型上的详细结果均优于其他基线模型。

    2024年10期 v.60;No.1049 121-131页 [查看摘要][在线阅读][下载 2390K]
    [下载次数:73 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 使用中心预测-聚类的3D箱体实例分割方法

    杨雨桐;和红杰;

    随着深度学习技术在工业领域的大量部署,应用于运输、装卸、包装、分拣等环节的自动化系统成为仓储物流行业的研究热点。针对机器人箱体拆垛场景提出一个点云中心预测-聚类网络(center prediction-clustering network,CPCN),对箱体垛进行实例分割,并计算每个箱体的上表面中心坐标。CPCN在传统的语义-实例联合分割结构的基础上,为实例分割分支设计了中心预测模块和中心强化模块。中心预测模块帮助定位实例中心以避免中心点分割错误,中心强化模块令属于同一实例的点在特征空间中向中心聚集,二者有效增强了实例特征的辨识能力。在实例特征处理部分设计的中心-实例聚类方法直接对实例特征进行距离度量来计算实例标签,大幅减少了计算时间。在箱体数据集上进行的实验表明,与现有方法相比CPCN在实例分割任务中的平均精确率最低提高了0.7个百分点,最高提高了17.2个百分点,预测实例中心的准确率达到94.4%,中心偏移量低至13.70 mm,且推理速度快于同类型的联合分割网络,对于箱体拆垛任务更有针对性,具有良好的应用价值。

    2024年10期 v.60;No.1049 132-139页 [查看摘要][在线阅读][下载 2776K]
    [下载次数:118 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 知识增强的自监督表格数据异常检测方法研究

    高小玉;赵晓永;王磊;

    传统的监督异常检测方法快速发展,为了减少对标签的依赖,自监督预训练方法得到了广泛的研究,同时研究表明额外的内在语义知识嵌入对于表格学习至关重要。为了挖掘表格数据当中存在的丰富知识信息,提出了一种基于知识增强的自监督表格数据异常检测方法(self-supervised tabular data anomaly detection method based on knowledge enhancement,STKE)并进行了改进。提出的数据处理模块将领域知识(语义)、统计数学知识融入到特征构建中,同时自监督预训练(参数学习)提供上下文知识先验,实现表格数据的丰富信息迁移。在原始数据上采用mask机制,通过学习相关的非遮掩特征来学习遮掩特征,同时预测在数据隐层空间加性高斯噪声的原始值。该策略促使模型即使在有噪声输入的情况下也能恢复原始的特征信息。使用混合注意机制有效提取数据特征之间的关联信息。在6个数据集上的实验结果展现了提出的方法优越的性能。

    2024年10期 v.60;No.1049 140-147页 [查看摘要][在线阅读][下载 1692K]
    [下载次数:175 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 保留模体信息的属性二分图神经网络表示学习

    吕少卿;王驰驰;李婷婷;包志强;

    目前网络表示学习方法大多针对通过网络,忽略了属性二分网络的特殊性以及网络的模体信息等。为了解决以上问题,提出一种保留模体信息的属性二分图神经网络表示学习方法 MABG。该方法首先通过网络中两节点共同参与形成的蝶形模体数量来调整边的权重,从而构建模体权重矩阵,获得包含模体信息的属性二分网络邻接矩阵。接着采取不同的策略捕捉网络中的显式和属性隐式消息,对于不同类型节点集合间的显式关系采用消息传递机制,对于同类型节点中的隐式关系采用消息对齐机制,同时使用对抗模型最小化输入特征和显式关系表示之间的差异,之后通过级联框架来捕捉高阶信息并得到最终的节点表示。将该模型在四个真实公开的数据集上执行推荐任务并与其他方法进行对比,验证了该模型的有效性。

    2024年10期 v.60;No.1049 148-155页 [查看摘要][在线阅读][下载 1649K]
    [下载次数:154 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 面向多视图融合的用户一致性社交推荐

    赵文涛;刘甜甜;薛赛丽;王德望;

    针对传统社交推荐准确率不高的问题,提出一种基于多视图融合的用户一致性社交推荐模型。该社交推荐模型考虑到社交网络中用户的不一致性和单一视图信息对推荐结果的影响,使用注意力机制动态过滤出不一致的社交邻居,并结合用户-项目交互信息来学习用户特征表达;同时从知识图谱(knowledge graph,KG)、用户-项目历史交互信息等多个视图学习项目在低维空间的特征表示;最后将用户和项目的特征表示进行内积操作,从而完成最终的推荐任务。为了验证推荐算法的有效性,在Douban和Yelp两个公开的数据集上与六个基线模型进行对比实验,并采用召回率、归一化折损累计增益(normalized discounted cumulative gain,NDCG)和精确率作为评估指标,实验结果表明,所提出的社交推荐模型的性能优于其他模型。

    2024年10期 v.60;No.1049 156-163页 [查看摘要][在线阅读][下载 1689K]
    [下载次数:136 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 多模型融合的VoxSRC22说话人日志系统

    杜雨轩;周若华;

    为有效解决“谁在什么时候说话”的问题,提出一种说话人日志方法。该方法由六个模块组成,包括语音活动检测(voice activity detection,VAD)、语音增强、说话人嵌入提取器、说话人聚类、重叠语音检测(overlapping speech detection,OSD)和结果融合。利用语音增强技术可以改善语音活动检测的性能。有效地结合不同的说话人嵌入提取器和聚类算法可以进一步降低系统错误率。在系统融合后处理重叠语音展示了最佳结果。实验结果表明,最佳系统的性能相对基线提升了72%,并在VoxCeleb说话人识别挑战赛(VoxCeleb speaker recognition challenge,VoxSRC)2022评估集上分别实现了5.48%的说话人日志错误率(diarization error rate,DER)和32.10%的杰卡德错误率(Jaccard error rate,JER),排名第四。

    2024年10期 v.60;No.1049 164-172页 [查看摘要][在线阅读][下载 1654K]
    [下载次数:178 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 融合知识图谱与注意力机制的项目推荐算法

    邢峻也;邢星;贾志淳;王鸿达;刘嘉雯;

    知识图谱蕴含丰富的语义信息,广泛应用在不同的推荐场景中。现有的基于知识图谱的推荐方法在图神经网络的建模过程中,粗粒度地考虑用户和项目交互的关系,构建用户特征模型时,忽略不同历史项目的重要性。针对此类问题,提出一种融合知识图谱与注意力机制的项目推荐算法。该算法聚合用户特征,使用注意力机制学习知识图谱高阶潜在关系,构建项目特征时传播其邻域之间的项目嵌入表示,用图卷积网络进行特征聚合,最后使用多层神经网络进行预测。该算法在两组公开数据集上,与基线算法进行对比实验,召回率最高提升6.9%。

    2024年10期 v.60;No.1049 173-179页 [查看摘要][在线阅读][下载 1837K]
    [下载次数:886 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 基于二阶图卷积自编码器的图表示学习

    袁立宁;蒋萍;莫嘉颖;刘钊;

    图卷积自编码器是一类高效的图表示学习模型,在链路预测等任务中具有出色性能。然而现有模型大多依赖图卷积网络对邻接矩阵和属性矩阵进行编码,未充分利用二阶信息等高阶结构特征。针对上述问题,提出了基于二阶信息的图卷积自编码器模型SeVGAE。首先使用图卷积和二阶图卷积生成变分自编码器的均值和方差,然后学习嵌入向量表示原始图的混合概率分布,最后使用内积解码器恢复拓扑结构。在链接预测任务中,SeGVAE表现优于基线模型,Citeseer数据集上的AUC和AP相较原始的VGAE分别提升了3.26%和2.56%。实验结果表明,二阶信息的引入能够在低维嵌入中保留更丰富的图信息,提升模型性能。模型在处理属性信息不足、拓扑信息不准确的图数据时具有较为明显的优势,在边缘和属性均缺失40%的极端情况下,SeVGAE的AUC和AP相较VGAE提升4.79%和3.47%。

    2024年10期 v.60;No.1049 180-187页 [查看摘要][在线阅读][下载 1738K]
    [下载次数:167 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]

图形图像处理

  • 全景视频中多运动对象检测与跟踪方法

    刘慧彤;王希;刘威;杨鹏;

    全景视频多运动对象检测与跟踪技术的通用解决方案是通过投影变换将360°视频转为二维视频后进行检测和跟踪。然而固定球面投影变换会导致全景视频中存在空间上不连续的投影边界,当运动对象处于投影边界时,常规球面投影方法可能将其切分为多个部分,从而导致该运动对象的漏检或误检。针对该问题,提出了融合等距柱状形投影(equi-rectangular projection,ERP)和立方体投影(cube map projection,CMP)的全景视频多运动对象检测与跟踪方法,利用合适的CMP拼接帧减少ERP两极区域失真并弥补其边界不连续性,解决了处于投影边界和两极扭曲的对象检测问题。进一步,通过感知哈希、球面质心和运动方向等多重特征融合来解决全景视频多运动对象跟踪问题。实验结果表明,提出的方案可以有效减少投影边界不连续导致的误检,且能有效应对遮挡、穿梭帧边界和两极扭曲的对象跟踪问题。

    2024年10期 v.60;No.1049 188-197页 [查看摘要][在线阅读][下载 2395K]
    [下载次数:165 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 特征互斥化的目标检测域适应方法

    李润泽;王子磊;

    当前,蒸馏学习已成为目标检测无监督域适应领域中的一种常用技术手段。然而蒸馏带来的特征偏移会导致目标域上伪标签的准确性较低,不利于目标域的精确检测。因此提出特征互斥化方法,包括特征分布互斥化和特征属性互斥化。其中特征分布互斥化鼓励网络对不同类别的特征分布进行互斥,特征属性互斥化促使分类器对不同类别主要使用的属性进行互斥。还提出强弱增强一致性方法对网络的预测输出进行一致性约束,促使网络提取的特征中主要包含与目标域检测相关的属性,进一步提高特征互斥化方法的效果。所提方法在多个域适应场景上进行了广泛的实验,在相同实验设置下的结果表明,所提方法较其他先进方法具有更好的有效性。

    2024年10期 v.60;No.1049 198-208页 [查看摘要][在线阅读][下载 2421K]
    [下载次数:147 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 基于图像实例分割的机器人箱体拆垛方法

    邹汶材;刘宝临;

    为了解决工业箱体包裹拆垛任务中传统特征提取方法依赖于箱体形状,难适用于规格多变、混箱垛型的问题,提出一种基于图像实例分割的机器人拆垛方法。为获得准确箱体拣选中心,首先利用Mask R-CNN进行实例分割获得箱体掩膜和分类信息,并在特征提取后添加空间变换网络(spatial transformation network,STN)模块,优化对旋转目标的识别;然后求解掩膜最小外接矩形并后处理获得待拣选箱体像素中心和水平旋转角度,并结合一种拆垛策略进行先行后列排序以确定拣选顺序;最后利用标定方法完成箱体定位,并对规格多变、混箱垛型进行分割和机器人拆垛实验,结果表明,待拆箱体像素中心平均像素距离约4个像素点,空间定位平均误差约1 cm,定位精度满足工业拆垛实际需求。

    2024年10期 v.60;No.1049 209-216页 [查看摘要][在线阅读][下载 2024K]
    [下载次数:175 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 可学习动态分组卷积神经网络的大规模点云分割

    康玥;杨军;

    针对现有大规模点云语义分割算法提取特征时冗余干扰信息过多,导致神经网络分割性能较差的问题,提出可学习动态分组卷积神经网络架构,高效准确地实现大规模点云分割。对输入点云以分组的方式进行局部几何特征提取,并通过动态筛选和修剪冗余特征通道来减少无用特征信息对神经网络特征识别的干扰,进一步提高网络模型语义分割精度。构建位置编码模块,将点云位置特征映射到高维频域空间,使神经网络充分挖掘点云频域特征信息,增强特征的丰富性。对提取到的局部几何特征和全局单点位置特征进行融合,并构建可学习动态分组卷积神经网络,完成解码得到最终分割结果。实验结果表明,该算法在大规模点云分割数据集S3DIS和SemanticKITTI上的mIoU分别为69.6%和58.3%。与现有点云语义分割方法相比,所提出的网络模型具有更高的分割准确率和较低的参数量。

    2024年10期 v.60;No.1049 217-226页 [查看摘要][在线阅读][下载 3057K]
    [下载次数:198 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 双特征流融合和边界感知的显著性目标检测

    杨鑫;朱恒亮;毛国君;

    显著性目标检测是计算机视觉领域的热门研究方向之一,许多基于深度学习的检测算法虽然已经取得了显著的成果,但是仍然存在待测目标漏检误检和边界模糊等问题。针对这些问题提出了一种基于双特征流融合和边界感知的目标检测算法,通过改变输入图像尺寸来丰富多尺度信息,并自顶向下逐层聚合特征得到精细的预测结果。首先将输入图像调整为两种不同分辨率分别送入编码器,提取丰富的多层级特征形成双特征流;其次将双特征流自顶向下逐层融合,生成由粗到细的显著图;最后构建了边界感知结构,凭借上下文语义信息的指导生成精细的物体轮廓。在五个公开数据集上进行了大量实验,实验结果表明,所提算法在结构相似性(Sm)等多个指标上取得了更高的检测精度,生成的显著图目标完整且边缘清晰。

    2024年10期 v.60;No.1049 227-236页 [查看摘要][在线阅读][下载 2361K]
    [下载次数:213 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 改进YOLOv7的城市小型无人机目标检测方法

    崔勇强;李嘉轩;侯林果;梅涛;白迪;陈少平;

    针对“低小动”无人机的反制技术已成为低空空域安全防御的重要手段,然而实时检测与准确识别是实施有效反制的前提条件与关键基础。针对城市低空环境下,目标检测算法对不同背景下小尺度无人机目标检测精度低,容易出现漏检误检且易受外界因素干扰等问题,提出了一种基于改进YOLOv7的“低小动”无人机目标检测方法。首先采集大量不同环境、不同背景下的无人机样本构建数据集,并采用ViBe(visual background extractor)算法进行预处理;其次引入坐标注意力机制与SPDConv(space-to-depth convolution)模块改进和优化YOLOv7的网络结构;最后提出融合ViBe和改进YOLOv7的二级检测架构,将改进后的YOLOv7作为网络模型检测经ViBe处理后的图像。依据原图与处理图像的位置大小关系,将检测出的目标坐标映射回归至原图片,从而完成目标检测提取。实验结果表明,所提目标检测方法检测精度达96.5%,较原YOLOv7方法提高了15.8个百分点,显著提升了“低小动”目标的检测精度,能够满足低空无人机的实时精准检测的需求。

    2024年10期 v.60;No.1049 237-245页 [查看摘要][在线阅读][下载 1849K]
    [下载次数:1174 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 基于改进YOLOv7的遥感图像小目标检测方法

    苗茹;岳明;周珂;杨阳;

    针对遥感图像中小目标数量众多且背景复杂所导致的识别精度低的问题,提出了一种改进的遥感图像小目标检测方法。该方法基于改进的YOLOv7网络模型,将双级路由注意力机制加入至下采样阶段以构建针对小目标的特征提取模块MP-ATT(max pooling-attention),使得模型更加关注小目标的特征,提高小目标检测精度。为了加强对小目标的细节感知能力,使用DCNv3(deformable convolution network v3)替换骨干网络中的二维卷积,以此构建新的层聚合模块ELAN-D。为网络设计新的小目标检测层以获取更精细的特征信息,从而提升模型的鲁棒性。同时使用MPDIoU(minimum point distance based IoU)替换原模型中的CIoU来优化损失函数,以适应遥感图像的尺度变化。实验表明,所提出的方法在DOTA-v1.0数据集上取得了良好效果,准确率、召回率和平均准确率(mean average precision,mAP)相比原模型分别提升了0.4、4.0、2.3个百分点,证明了该方法能够有效提升遥感图像中小目标的检测效果。

    2024年10期 v.60;No.1049 246-255页 [查看摘要][在线阅读][下载 1893K]
    [下载次数:1670 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 电力巡检中改进YOLOv5s的缺陷检测算法研究

    王磊;郝涌汀;潘明然;赵慕东;张永鑫;张茗宇;

    针对无人机进行电力巡检时关键零件的检测精度较低的问题,提出了一种基于YOLOv5s的改进型缺陷检测算法。在骨干网络中引入卷积神经网络注意力模块(CBAM),增强网络对特征图中重要信息的提取效率;将YOLOv5s中原有的PANet特征融合框架替换为双向特征金字塔网络(BiFPN),引入可学习的权重,映射不同的学习特征,增加对贡献较大特征的映射。在空间金字塔池化模块(spatial pyramid pooling,SPP)的基础上加入上下文卷积模块,提升特征的表达能力。通过构建航拍数据集进行实验验证,结果表明,改进后的算法mAP达到95.6%,准确率达到93.7%,召回率达到93.8%。为进一步验证算法在嵌入式系统的运行效果,通过缩小网络宽度进行轻量化,利用TensorRT推理引擎,优化了网络结构并加速了模型的推理。将模型加速后部署至Jetson Xavier NX平台进行测试,单帧图像平均运行时间为24.6 ms,检测准确率为90.8%,召回率为90.5%,能够在Jetson Xavier NX设备上对目标实现精准识别。改进后的模型提高了检测精度,体现了算法的有效性,满足电力巡检作业的实时检测需求。

    2024年10期 v.60;No.1049 256-265页 [查看摘要][在线阅读][下载 5693K]
    [下载次数:1490 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 改进YOLOv7的X光图像危险品检测算法

    张继龙;赵军;李金龙;

    针对X光安检图像在危险品检测时背景复杂、遮挡严重、尺度多变等问题,对YOLOv7算法进行了改进,在提高检测精度的同时使网络更加轻量化。首先构建PS-ELAN模块替换原主干网络中的ELAN模块,减少网络计算量和内存占用,同时提升网络的特征提取能力。其次将无参注意力机制SimAM与可变形卷积DCNv2融合至颈部网络的下采样阶段,提高网络对X光图像危险品关键特征的捕捉能力。最后引入Dynamic Head模块,增强检测头的尺度感知、空间感知和任务感知,提高网络的检测性能。实验结果表明,改进后的算法在自制数据集和CLCXray数据集上的平均精度均值(mean average precision,mAP)比原YOLOv7模型分别提高了4.7个百分点和1.2个百分点,参数量和计算量分别下降了16.2%和23.1%。改进后的算法提高了检测能力,同时更为轻量化,可在实际安检中起到很好的辅助作用。

    2024年10期 v.60;No.1049 266-275页 [查看摘要][在线阅读][下载 2198K]
    [下载次数:1055 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 改进YOLOv5的无人机小目标检测方法研究

    白宇;周艳媛;安胜彪;

    无人机拍摄图像的小目标具有特征信息不明显、背景复杂和部分目标遮挡的特点,导致检测时会出现误检和漏检的问题。针对这些问题,提出一种改进YOLOv5的无人机小目标检测方法 SDT-YOLOv5。首先对数据集图像进行切片处理,使得每个切片中小目标的占比变高,提高小目标的识别能力。其次采用动态解耦检测头,引入动态卷积和自适应感受野机制,同时将检测头的分类和回归分支解耦,以实现更强的特征表达和提取能力。最后提出了基于最小点距离的交并比损失的最佳传输分配方法。最小化预测边界框与真实边界框之间的左上角和右下角点距离,再基于边界框的位置信息和距离度量,以最小化总成本为目标,找到最优的真实边界框与预测边界框匹配方案,提高检测的准确性。在VisDrone2019数据集上进行实验,结果显示改进YOLOv5的mAP50值达到了58.5%,相比于原始YOLOv5的mAP50值提高了23.2个百分点。这表明改进方法有效地提高了无人机小目标的检测精度,能够更准确地检测到小目标。

    2024年10期 v.60;No.1049 276-284页 [查看摘要][在线阅读][下载 1980K]
    [下载次数:2218 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 基于相机运动估计的改进ECO多目标跟踪器设计

    陈健超;奚峥皓;刘翔;

    由于运动模型采用线性假设,使得多目标跟踪(multiple object tracking,MOT)在动态场景下容易受到相机运动和随机抖动的影响,导致跟踪错误。为解决上述问题,设计了一种相机运动感知滤波多目标跟踪器(camera motion aware filter multi-object tracker,CMAFT)。首先提出一种新模型,将相机运动估计和单目标跟踪(single object tracking,SOT)的区域搜索特性相结合,以补偿由相机运动引起的偏移并提高预测的准确度;其次针对该模型提出一个改进的级联匹配方法,通过融合SOT预测以处理不同目标间的相互遮挡和身份切换问题;最后在MOT17数据集上进行实验以验证提出方法的有效性。

    2024年10期 v.60;No.1049 285-291页 [查看摘要][在线阅读][下载 2595K]
    [下载次数:163 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]

大数据与云计算

  • 利用图神经网络的互补产品推荐

    倪伟竣;纪淑娟;梁永全;

    互补产品推荐可以提供互补搭配的产品,为用户提供便利。然而现有使用图神经网络的工作忽视了产品的多模态信息,以及多模态模型在模态信息缺失时性能会受到影响。现有多模态模型只是将模态简单拼接,忽略了模态间的联系。因此,提出了一种利用图神经网络的互补产品推荐模型(complementary product recommendation using graph neural network,CPRUG)。该模型将图神经网络与多模态信息结合,强化产品的表征;利用图注意力网络,应对多模态缺失问题,维持模型的性能,提高模型的鲁棒性;使用共同注意力机制和矩阵分解双线性池化方法来融合多模态特征,学习产品的互补关系。在Amazon数据集上进行了实验,实验结果表明,模型的性能优于其他基线模型。

    2024年10期 v.60;No.1049 292-300页 [查看摘要][在线阅读][下载 1865K]
    [下载次数:171 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 混合动作空间下的多设备边缘计算卸载方法

    张冀;齐国梁;朵春红;龚雯雯;

    为降低多设备多边缘服务器场景中设备层级的总成本,并解决现有深度强化学习(deep reinforcement learning,DRL)只支持单一动作空间的算法局限性,提出基于混合决策的多智能体深度确定性策略梯度方法(hybrid-based multi-agent deep determination policy gradient,H-MADDPG)。首先考虑物联网设备/服务器计算能力随负载的动态变化、时变的无线传输信道增益、能量收集的未知性、任务量不确定性多种复杂的环境条件,建立MEC系统模型;其次以一段连续时隙内综合时延、能耗的总成本最小作为优化目标建立问题模型;最后将问题以马尔科夫决策过程(Markov decision procession,MDP)的形式交付给H-MADDPG,在价值网络的辅助下训练并行的两个策略网络,为设备输出离散的服务器选择及连续的任务卸载率。实验结果表明,H-MADDPG方法具有良好的收敛性和稳定性,从计算任务是否密集、延迟是否敏感等不同角度进行观察,H-MADDPG系统整体回报优于Local、OffLoad和DDPG,在计算密集型的任务需求下也能保持更大的系统吞吐量。

    2024年10期 v.60;No.1049 301-310页 [查看摘要][在线阅读][下载 1896K]
    [下载次数:157 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]

工程与应用

  • 结合维诺区域分割和路径优化的路径规划算法

    江纯兴;吴锋;

    在一些较大面积的建筑物内,移动机器人的路径规划算法的效率仍然面临着较大的挑战。针对这类工作场景,提出了一种结合维诺区域分割和路径优化的路径规划算法(Voronoi region segmentation and path optimization,VSO),实现在大规模室内场景下的快速路径规划。该算法使用广义维诺图(generalized Voronoi graph,GVG)从地图中构建拓扑图,在拓扑图上可以快速获得初始启发式路径。通过将采样过程约束在初始路径周围的区域,减少了对工作空间的过度探索。在此基础上,选择路径点将采样区域划分为多个子区域,之后在子区域中并行搜索路径来减少搜索空间并提升搜索速度。最后将连接各个子区域内的路径作为结果路径,并使用优化算法来平滑最终路径。仿真实验与机器人实验验证了该算法的实用性与有效性。

    2024年10期 v.60;No.1049 311-319页 [查看摘要][在线阅读][下载 1983K]
    [下载次数:336 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 基于超图理论的中医方剂网络药对挖掘方法

    符康;闫光辉;罗浩;

    随着复杂网络研究的深入发展,利用复杂网络理论对中药药方数据进行建模分析已成为研究中药配伍规律的重要方法之一。然而,传统的“药-药”网络结构只基于“点-边”关系,无法体现方剂和中药之间的高阶交互关系,从而影响药对挖掘的准确率和效果。针对该问题,提出了一种基于超图的方药超网络建模方法来刻画方剂与中药之间的高阶关联关系,以方剂为超边、方剂中的中药为节点构建方药超网络,对比传统“药-药”网络和方药超网络的统计特性发现,方药超网络节点超度分布更加符合幂律分布特征,具有小世界和无标度特性,证明了方药超网络建模方法具有合理性和可行性;基于方药超网络提出一种融合多因素的双权重度中心性指标(double weight degree centrality,DWDC)挖掘方剂中的常见中药,引入超边属性对节点特性的影响,以网络的脆弱性和鲁棒性为依据,通过各算法之间的对比实验,验证所提出方法能够更有效筛选出方剂超网络中的常见中药;再将DWDC指标推广到二阶常见药对挖掘,提出高阶指标H-DWDC,基于真实数据集的实验结果表明,该方法能够有效地从海量数据中挖掘出常见药对。

    2024年10期 v.60;No.1049 320-331页 [查看摘要][在线阅读][下载 1973K]
    [下载次数:296 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 融合LoG特征的凸焊螺母检测算法

    罗柏槐;李扬;林熙烨;周梓斌;

    针对目前汽车曲面零部件的紧固连接中常用的凸焊工艺中出现凸焊螺母的漏焊、错焊,以及主要依赖人工目测的低效检测方法等问题,提出了一种基于Faster-RCNN的凸焊螺母检测算法。以Faster-RCNN作为基础模型,针对模型在不同角度下螺母特征各异且难以提取的问题,提出提取LoG特征和原图像自适应融合的方法,以增强模型对螺母特征的提取能力;引入特征金字塔(feature pyramid network,FPN)解决小目标难以被精确检测的问题;为了提升网络在复杂背景中的检测鲁棒性,在FPN中嵌入坐标注意力机制来提升网络对重点目标的关注;设计损失函数,提升训练效果,增强回归框中心点的回归精确度。实验结果表明,所提算法相比原算法,在IoU=0.75时凸焊螺母的检测精确率上升了8.65个百分点,达到90.11%,召回率上升了5.87个百分点,达到79.23%,相比原算法具有明显改善。

    2024年10期 v.60;No.1049 332-340页 [查看摘要][在线阅读][下载 2370K]
    [下载次数:106 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 基于碰撞预测的强化模仿学习机器人导航方法

    王浩杰;陶冶;鲁超峰;

    基于学习的机器人导航方法存在对数据的依赖性高和在一些特定环境下表现不完美的问题,例如在空旷场景下无法走直线,在障碍物密集场景下碰撞率高。为了提高机器人的导航性能,提出了一种基于碰撞预测的强化模仿学习导航方法。在无模型的情况下,根据机器人的性能,建立马尔科夫决策过程(Markov decision process,MDP)中所需要的状态空间、动作空间、奖励函数。采用深度强化学习(deep reinforcement learning,DRL)在仿真环境中进行训练,使机器人获得能够在多障碍环境中导航和避障的能力。使用收集到的专家数据按照模仿学习方法对策略继续进行训练,改善强化学习在障碍物稀疏和密集两种极端情况下表现不完美的问题。设计了一个碰撞预测模型,将传统控制与深度学习相结合,根据预测结果,使机器人自适应地在不同环境下选取合适的控制策略,大大提高了导航的安全性。通过实验,在大量从未遇到过的场景下验证了所提出方法的导航性能和泛化能力。

    2024年10期 v.60;No.1049 341-352页 [查看摘要][在线阅读][下载 4642K]
    [下载次数:185 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 改进遗传算法搜索动态订单下车辆路径最优问题

    李二超;张智钊;

    滚动周期策略是当前学者利用优化算法解决动态车辆路径规划(dynamic vehicle routing planning,DVRP)问题的主要研究策略。预优化算法是基于遗传算法(genetic algorithm,GA)进行改进。GA易早熟和易陷入局部最优的特点,使解的质量往往不能达到最好。针对此问题,在GA算法上提出了贪婪重构策略进行改进。贪婪重构遗传算法(greedy reconstruction genetic algorithm,GRGA)随机剔除每条路径固定数量的客户点,利用贪婪重构策略依次将剔除点插入到各个路径,保留成本最低的解,摒弃了完全随机的策略原则,使解可以跳出局部最优。在每次迭代之后利用变邻域下降搜索算法(variable neighborhood descent,VND)进行深度搜索,完成一次迭代。最后进行三组测试,第一组是在统一平台上采用Solomon数据集测试算法效果,第二组是把预优化改进算法与对比算法得到的数据分别进行保存,利用控制变量法在动态调度周期使用一种动态调度优化算法,分别对每个预优化算法形成的初始路径进行调度,测试改进算法的有效性,第三组是采用实际案例测试预优化算法的效果。

    2024年10期 v.60;No.1049 353-364页 [查看摘要][在线阅读][下载 2033K]
    [下载次数:999 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]

  • “垂直领域大模型构建与应用”专题征文通知

    <正>近年来,基于大规模语料训练的大参数量语言模型在自然语言理解和生成方面展现出了卓越的性能。同样,基于大规模文本、图像、视频等数据训练的多模态大模型也在视觉内容理解和生成方面表现出色。这些大模型凭借其出色的泛化能力和丰富的参数化知识,能够通过精心设计的指令和微调技术迅速适应新任务。因此,利用这些具有强大泛化能力的大模型解决各个领域的专业问题成为了研究和应用的热点。

    2024年10期 v.60;No.1049 365页 [查看摘要][在线阅读][下载 239K]
    [下载次数:1 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
  • 下载本期数据