基于多模态表征学习的自动音频字幕方法
在自动音频字幕(automated audio captioning,AAC)和大多数多模态研究领域中,模态差异一直构成重大挑战。增强模型对文本信息的理解,在建立文本和音频两种模态之间的无缝连接中起着至关重要的作用。最近的研究集中在通过对比学习的方法...
计算机应用研究
2025年06期
立即查看 >
图书推荐
相关工具书