面向视觉-语言模型的递进互提示学习-计算机应用研究2025年06期-手机知网

手机知网 App

24小时专家级知识服务

计算机软件及计算机应...

面向视觉-语言模型的递进互提示学习

浙江理工大学计算机科学与技术学院(人工智能学院);嘉兴大学信息科学与工程学院;嘉兴市计量检定测试院 | 陶俊杰张卫锋王玉霞缪翌徐领

开通知网号

大规模预训练视觉-语言模型CLIP(contrastive language-image pretraining)可将输入图像和文本投影到公共语义空间实现跨模态对齐,且在广泛的下游任务上展现了较强的泛化能力。然而,现有的提示学习方法通常在CLIP的视...

机　构:

浙江理工大学计算机科学与技术学院(人工智能学院)；嘉兴大学信息科学与工程学院；嘉兴市计量检定测试院；

领　域:

计算机软件及计算机应用；自动化技术；

关键词:

多模态；提示学习；视觉-语言模型；Transformer编码器；

格　式:

PDF原版；EPUB自适应版(需下载客户端)

开通会员更优惠，尊享更多权益

手机阅读本文

下载APP 手机查看本文

计算机应用研究

相似文献

期刊硕士博士会议报纸

图书推荐

相关工具书