多维度交叉注意力融合的视听分割网络-计算机应用研究2025年06期-手机知网

手机知网 App

24小时专家级知识服务

多维度交叉注意力融合的视听分割网络

扬州大学信息工程学院 | 李凡凡张垣垣章永龙朱俊武

开通知网号

视听分割是根据图片和声音定位并精准分割图片中的发声对象。虽然目前大多数研究工作主要侧重于探索视听信息融合方法,但对于视听细粒度挖掘不够深入,特别是在对齐连续音频特征与空间像素级信息方面。因此,提出了基于对比学习的视听分割注意力融合方法(AVSAF)。...

机　构:

扬州大学信息工程学院；

领　域:

电信技术；计算机软件及计算机应用；

关键词:

视听分割；多模态；对比学习；注意力机制；

开通会员更优惠，尊享更多权益

手机阅读本文

下载APP 手机查看本文

计算机应用研究

相似文献

期刊硕士博士会议报纸

图书推荐

相关工具书