一种基于奇异值分解增强路由函数的多模态任务的微调方法

AITNT
正文
推荐专利
一种基于奇异值分解增强路由函数的多模态任务的微调方法
申请号:CN202511082633
申请日期:2025-08-04
公开号:CN121009338A
公开日期:2025-11-25
类型:发明专利
摘要
发明公开了一种基于奇异值分解增强路由函数的多模态任务的微调方法,包括使用PEFT方法将输入的语言与视觉特征从高维空间映射到低秩空间,通过对低秩空间中的语言特征进行奇异值分解,通过高效重构后的张量进行路由函数对齐,最后重新从低秩空间恢复到原始维度后,与原始语言特征进行残差连接,并输出特征。本发明通过在路由函数之前对语言特征应用奇异值分解,提取其低秩主导模式,增强视觉和语言特征的对齐精度,消除高维噪声的干扰,同时保持计算效率和模型稳定性。通过重构后的张量进行路由计算,可以更好地提取和对齐特征中的关键信息,从而提升特征对齐的精度和效果。适用于视觉问答、图像描述生成等VL任务,能够明显提升模型性能。
技术关键词
微调方法 保留特征 输出特征 缓存机制 视觉特征信息 浮点数 跨模态 元素 序列 矩阵恢复 近似误差 重构误差 瓶颈 新鲜度 语义 文本
系统为您推荐了相关专利信息
1
基于大语言模型与数据合成的毫米波语义信息提取方法
语义信息提取方法 大语言模型 三维人体运动 运动生成模型 特征提取器
2
用于少样本缺陷图像生成的扩散模型微调方法和装置
微调方法 缺陷类别 分支 图像生成模型 样本
3
基于CPU/NPU协同计算的卷积神经网络编译方法
神经网络编译方法 自定义算子 数据传输开销 最大化吞吐量 任务调度
4
基于环境感知的具身智能任务规划方法、装置、设备及介质
大语言模型 规划 轨迹 命名实体识别技术 序列
5
一种基于人工智能与光纤传感器融合的声源空间定位方法、系统、终端及存储介质
声源空间定位方法 光纤传感器 深度信念网络 时间差 空间定位信息
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号