在处理复杂实际问题时,我们可以结合多尺度特征融合和注意力机制,让模型不仅能从多个尺度上捕获丰富的特征信息,还可以专注于输入中的关键部分,来提高模型的泛化能力和性能。
具体到图像处理领域,这种方法就是允许模型从高分辨率下捕捉到细微的纹理和边缘信息,同时在低分辨率下维持对整体场景布局的感知。比如基于多尺度特征融合和双线性注意力机制的木材近红外光谱分类方法BACNN,实验证明它在测试集上达到了99.3%的准确率。
当然这种结合策略不仅限于提高图像识别的准确性,它还可以用于增强视频分析、语音识别等领域的性能,应用前景非常之广泛。
为方便各位快速了解前沿,我这次整理了9个最新的多尺度特征融合+注意力机制创新方案,开源代码贴心附上~
论文原文+开源代码需要的同学关注“学姐带你玩AI”公众号,那边回复“特征注意”获取。
BACNN: Multi?scale feature fusion?based bilinear attention convolutional neural network for wood NIR classifcation
方法:提出了一种基于多尺度特征融合的双线性注意力卷积神经网络模型,用于对杨木、桐木、葫芦木、PVA修饰杨木、纳米二氧化硅溶胶修饰杨木和PVA-纳米二氧化硅溶胶修饰杨木的近红外光谱进行分类。BACNN通过添加卷积核作为1×7卷积块来减轻噪声的影响,然后使用两个分支从不同尺度提取光谱的特征,同时添加SE模块以获得更好的质量特征,最后使用全连接层进行分类。
创新点:
- 提出了基于多尺度特征融合的双线性注意力卷积神经网络模型(BACNN),结合近红外光谱和卷积神经网络,用于分类不同类型的木材。
- 在实验中进行了对比测试,将BACNN与BP、SVM、AlexNet、LeNet和VGGNet-11等方法进行了比较。通过对比分析这些模型的损失函数和准确率曲线以及混淆矩阵,得出了它们在准确度、精确率、召回率、F1值等指标上的综合对比结果,并得出了结论。
HiFuse: Hierarchical multi-scale feature fusion network for medical image classification
方法:HiFuse 网络结构是一种多尺度特征融合方法,它结合了注意力机制。HiFuse模型通过局部特征块、全局特征块和层次特征融合块(HFF块)提取和融合医学图像分类任务中病变区域的深浅特征和全局局部特征。
创新点:
- 提出了HiFuse模型,结合局部和全局特征块,并设计了层次特征融合块(HFF块)来融合这些特征,并保持局部和全局分支的完整性。
- HiFuse模型在ISIC2018、Covid-19和Kvasir数据集上取得了相对较好的结果。
- 针对不同数据集设计了有针对性的动态层次特征选择,进一步提高了HiFuse模型的性能。
Three?dimensional visualization of thyroid ultrasound images based on multi?scale features fusion and hierarchical attention
方法:论文提出了一种改进的Unet++模型,称为PA-Unet++,用于提高甲状腺及其周围组织的多目标分割精度,并通过解决超声图像中的噪声干扰来实现这一点。
创新点:
- 引入了金字塔池化模块(PPM)和注意力门控机制(AG):作者在改进的U-net++架构中加入了PPM和AG,通过扩大网络感受野、整合不同区域的上下文信息和提高网络获取全局信息的能力,显著提高了分割效果。
- 结合深监督算法和密集跳跃连接:作者通过确定训练数据的最佳网络深度,进行了四种解码方法的比较实验。采用深监督算法和密集跳跃连接,能够从不同特征层解码,或者从所有特征层的组合解码。
Object Detection of Remote Sensing Image Based on Multi-Scale Feature Fusion and Attention Mechanism
方法:论文提出了一个结合多尺度特征融合和注意力机制的改进模型。具体来说,这个模型在原有YOLOv5的基础上增加了针对小目标检测的P2检测头,并通过多尺度特征融合金字塔网络DSI-FPN和自适应通道空间注意力机制SCBAM来增强模型对小目标的检测能力。
创新点:
- 作者采用知识蒸馏方法进行轻量级设计。优化的YOLOv5m作为主教师网络,ResNet50、MobileNetv3和ShuffleNetv2分别作为辅助教师网络。联合教师网络共同指导学生网络进行训练和学习。
- 为了解决遥感图像中小目标的检测问题,本文在原始YOLOv5模型的三个检测层的基础上增加了一个专门用于小目标的检测层,并在后续的多尺度特征融合中引入了浅层高分辨率特征图。本文还提出了增强的DSI-FPN多尺度特征融合金字塔网络,可以为网络检测生成更丰富有效的图像特征图层。
论文原文+开源代码需要的同学关注“学姐带你玩AI”公众号,那边回复“特征注意”获取。
本文暂时没有评论,来添加一个吧(●'◡'●)