图像情感信息增强的视觉问答模型
视觉问答是指给定一张图像和与该图像内容相关的自然语言问题,并让计算机做出正确回答的多媒体理解任务。早期的视觉问答模型往往忽略了图像中的情感信息,使得其在回答与情感相关的问题时表现不足;另一方面,现有的融合情感信息的视觉问答模型对图像关键区域和文本关键...
桂林电子科技大学学报
2025年01期
立即查看 >
图书推荐
相关工具书