多模态模型的训练方法、模型、图像识别方法及相关产品

AITNT
正文
推荐专利
多模态模型的训练方法、模型、图像识别方法及相关产品
申请号:CN202510482755
申请日期:2025-04-17
公开号:CN120494125A
公开日期:2025-08-15
类型:发明专利
摘要
本申请公开了一种多模态模型的训练方法、模型、图像识别方法及相关产品,涉及机器学习技术领域,多模态模型的训练方法包括:基于多模态样本数据生成多模态提示特征,将多模态提示特征进行跨模态映射,得到目标模态预测信息;通过目标模态预测信息和对应的样本数据确定模态对齐损失;通过反向映射模态信息和对应的样本数据确定内容对齐损失,反向映射模态信息是目标模态预测信息通过反向跨模态映射生成的,反向跨模态映射是跨模态映射的逆过程;通过模态对齐损失、内容对齐损失优化跨模态映射、反向跨模态映射和提示信息中涉及到的可学习参数,以完成训练。本申请实施例能够提高多模态模型的性能和用户的使用体验。
技术关键词
多模态 跨模态 图像识别方法 样本 转换文本 数据 视觉特征 计算机程序产品 图像编码 电子设备 编码模块 推土机 机器学习技术 参数 存储器 处理器
系统为您推荐了相关专利信息
1
一种多粒度医学文本信息指导的3D多模态融合方法
融合方法 切片 数据流特征 影像 医学
2
一种基于kmeans与iForest决策异常行为的识别方法
识别方法 店铺 粒子群算法 决策 数据
3
互监督缺陷检测方法及装置
深度特征提取网络 特征值 缺陷检测方法 注意力 图像
4
双馈感应风力发电机的高电压穿越优化控制方法及系统
感应风力发电机 电网侧变流器 转子侧变流器 优化控制方法 数学模型
5
一种光纤线路故障检测方法及系统
光谱重建模型 重构模型 光纤线路故障检测 光纤网络 联合损失函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号