手机知网 App
24小时专家级知识服务
打 开
电信技术
手机知网首页
文献检索
期刊
工具书
图书
我的知网
充值中心
基于多模态表征学习的自动音频字幕方法
重庆邮电大学通信与信息工程学院;
西交利物浦大学智能科学系
|
谭力文
周翊
柳银
曹寅
开通知网号
在自动音频字幕(automated audio captioning,AAC)和大多数多模态研究领域中,模态差异一直构成重大挑战。增强模型对文本信息的理解,在建立文本和音频两种模态之间的无缝连接中起着至关重要的作用。最近的研究集中在通过对比学习的方法...
机 构:
重庆邮电大学通信与信息工程学院;
西交利物浦大学智能科学系;
领 域:
电信技术;
计算机软件及计算机应用;
关键词:
音频字幕;
表征学习;
对比学习;
模态差异;
孪生网络;
格 式:
PDF原版;EPUB自适应版
(需下载客户端)
0
86
开通会员更优惠,尊享更多权益
下载PDF版
手机阅读本文
下载APP 手机查看本文
计算机应用研究
2025年06期
立即查看 >
相似文献
期刊
硕士
博士
会议
报纸
加载中
更多
暂无数据
图书推荐
更多
相关工具书
更多
搜 索