摘要
本发明提出了一种基于视觉语义数据增强的模型优化方法,用于改进视觉语义任务下的模型性能。本方法聚焦场景中的物体语义信息对模型的影响,首先利用预设的数据集评估模型表现,根据模型表现和场景数据,利用大语言模型总结关键的语义信息,再将这个语义信息注入到新产生的数据中,进而生成新的模型训练数据,并形成不断改进的循环。相比传统数据增强方法,本发明实现了数据增强过程与模型缺陷的匹配,以自动化的形式提供更适合提高模型性能的训练场景,可以用于视觉语义导航、视觉语言导航等多个具身任务。
技术关键词
模型优化方法
语义
大语言模型
物体
视觉
关系
数据更新
训练数据量
视角
计算机
可读存储介质
训练场景
优化装置
分析模块
决策
列表
定义