手机知网 App
24小时专家级知识服务
打 开
计算机软件及计算机应...
手机知网首页
文献检索
期刊
工具书
图书
我的知网
充值中心
面向视觉-语言模型的递进互提示学习
浙江理工大学计算机科学与技术学院(人工智能学院);
嘉兴大学信息科学与工程学院;
嘉兴市计量检定测试院
|
陶俊杰
张卫锋
王玉霞
缪翌
徐领
开通知网号
大规模预训练视觉-语言模型CLIP(contrastive language-image pretraining)可将输入图像和文本投影到公共语义空间实现跨模态对齐,且在广泛的下游任务上展现了较强的泛化能力。然而,现有的提示学习方法通常在CLIP的视...
机 构:
浙江理工大学计算机科学与技术学院(人工智能学院);
嘉兴大学信息科学与工程学院;
嘉兴市计量检定测试院;
领 域:
计算机软件及计算机应用;
自动化技术;
关键词:
多模态;
提示学习;
视觉-语言模型;
Transformer编码器;
格 式:
PDF原版;EPUB自适应版
(需下载客户端)
0
97
开通会员更优惠,尊享更多权益
下载PDF版
手机阅读本文
下载APP 手机查看本文
计算机应用研究
2025年06期
立即查看 >
相似文献
期刊
硕士
博士
会议
报纸
加载中
更多
暂无数据
图书推荐
更多
相关工具书
更多
搜 索