基于层次化多模态精细调节的视觉问答优化方法与系统

AITNT
正文
推荐专利
基于层次化多模态精细调节的视觉问答优化方法与系统
申请号:CN202510472099
申请日期:2025-04-16
公开号:CN120011547B
公开日期:2025-06-27
类型:发明专利
摘要
本发明公开了一种基于层次化多模态精细调节的视觉问答优化方法与系统,通过创新的自适应跨模态桥接与多层组逐阶段低秩适配方法,显著提升了跨模态学习的精度和效果。所述方法通过在视觉特征中引入多层次语义感知的文本信息,使得视觉特征得到更精细的调整与优化,从而解决了视觉特征与文本语义匹配的不一致问题。通过多层组逐阶段低秩适配,有效避免了感知误差的累积,提供了一种逐层适配的机制,使得视觉特征和文本特征在多层次的学习过程中能够更加精确地对齐。本发明为跨模态任务中的视觉‑文本特征融合提供了新的思路和方法,能够更好地捕捉文本与视觉领域的高层次交互,从而提升VQA任务的性能。
技术关键词
文本编码器 适配器 多头注意力机制 融合特征 跨模态 视觉特征提取 桥接模块 特征提取模块 语义 投影模块 线性 多模态 层级 感知误差 参数 多层次 元素
系统为您推荐了相关专利信息
1
一种基于稠密残差的深度学习模型遥感图像融合方法
遥感图像融合方法 深度学习模型 多光谱遥感影像 全色 损失函数优化
2
一种基于自注意力深度自编码神经网络的入侵检测方法
入侵检测方法 注意力 网络流特征 重构参数 融合特征
3
面向水下机器人图像处理的对偶互补动态卷积优化方法及系统
水下机器人 调制特征 卷积优化方法 机械臂末端执行器 融合特征
4
基于动态融合与时序分析的网络舆情智能预测系统及方法
融合特征 ARIMA模型 时序特征 时间间隔特征 LightGBM模型
5
基于单一适配器的多设备充电测试方法、设备及存储介质
充电测试方法 端口 协议 编码 电压
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号