基于多模态表征学习的自动音频字幕方法-计算机应用研究2025年06期-手机知网

基于多模态表征学习的自动音频字幕方法

在自动音频字幕(automated audio captioning,AAC)和大多数多模态研究领域中,模态差异一直构成重大挑战。增强模型对文本信息的理解,在建立文本和音频两种模态之间的无缝连接中起着至关重要的作用。最近的研究集中在通过对比学习的方法...

机　构:

领　域:

关键词:

格　式:

PDF原版；EPUB自适应版(需下载客户端)