一种面向模态缺失场景的动态解耦提示生成与调优方法

正文

推荐专利

申请号：CN202510956096

申请日期：2025-07-11

公开号：CN120451729A

公开日期：2025-08-08

类型：发明专利

摘要

本发明涉及计算机视觉与自然语言处理技术，提出了一种面向模态缺失场景的动态解耦提示生成与调优方法。通过多通道机制分离模态特征学习与对齐过程，有效解决了现有多模态模型在模态缺失场景下性能显著下降的问题。设计了轻量化多模态提示生成器，通过轻量级残差网络生成缺失模态补偿提示，显著提升了计算效率，同时通过动态提示融合策略实现了模态特征的高效整合，显著增强了模型对多模态信息的利用效率和贡献能力。基于单通道冻结‑优化策略与非强耦合对齐通道联合调优机制实现了动态解耦的多通道提示调优，独立优化不同模态的特性且对模态间的信息进行非强耦合融合，显著降低了模型对单一模态信息的过度依赖，实现了模态间的信息平衡。

技术关键词

文本动态视觉多模态融合策略模态特征多通道预训练模型场景编码器序列解码器调优技术解耦机制图像块网络数据多层感知机

系统为您推荐了相关专利信息

基于5G通信的智能水务远程运维系统及故障诊断方法

云端智能平台智能水务远程运维系统水务系统故障诊断模型

虚拟电厂与综合监控安全平台集成的智能管理系统

智能管理系统特征评估模型策略特征提取模块评估准则

空调外机电气安检方法、系统、装置和计算机设备

空调外机电气视觉定位模块检测点机器人

一种动态跨视图节点交互的端到端多视图聚类方法及系统

节点特征聚类方法神经网络模型编码器多层感知机

基于图像分析的烤瓷义齿颜色调整方法及系统

图像分析边缘检测技术反射率影像义齿

一种面向模态缺失场景的动态解耦提示生成与调优方法

站点导航

APP 下载