一种基于奇异值分解增强路由函数的多模态任务的微调方法

正文

推荐专利

申请号：CN202511082633

申请日期：2025-08-04

公开号：CN121009338A

公开日期：2025-11-25

类型：发明专利

摘要

发明公开了一种基于奇异值分解增强路由函数的多模态任务的微调方法，包括使用PEFT方法将输入的语言与视觉特征从高维空间映射到低秩空间，通过对低秩空间中的语言特征进行奇异值分解，通过高效重构后的张量进行路由函数对齐，最后重新从低秩空间恢复到原始维度后，与原始语言特征进行残差连接，并输出特征。本发明通过在路由函数之前对语言特征应用奇异值分解，提取其低秩主导模式，增强视觉和语言特征的对齐精度，消除高维噪声的干扰，同时保持计算效率和模型稳定性。通过重构后的张量进行路由计算，可以更好地提取和对齐特征中的关键信息，从而提升特征对齐的精度和效果。适用于视觉问答、图像描述生成等VL任务，能够明显提升模型性能。

技术关键词

微调方法保留特征输出特征缓存机制视觉特征信息浮点数跨模态元素序列矩阵恢复近似误差重构误差瓶颈新鲜度语义文本

系统为您推荐了相关专利信息

基于大语言模型与数据合成的毫米波语义信息提取方法

语义信息提取方法大语言模型三维人体运动运动生成模型特征提取器

用于少样本缺陷图像生成的扩散模型微调方法和装置

微调方法缺陷类别分支图像生成模型样本

基于CPU/NPU协同计算的卷积神经网络编译方法

神经网络编译方法自定义算子数据传输开销最大化吞吐量任务调度

基于环境感知的具身智能任务规划方法、装置、设备及介质

大语言模型规划轨迹命名实体识别技术序列

一种基于人工智能与光纤传感器融合的声源空间定位方法、系统、终端及存储介质

声源空间定位方法光纤传感器深度信念网络时间差空间定位信息

一种基于奇异值分解增强路由函数的多模态任务的微调方法

站点导航

APP 下载