基于视觉语义数据增强的模型优化方法、装置和存储介质

正文

推荐专利

申请号：CN202510480675

申请日期：2025-04-17

公开号：CN120495802A

公开日期：2025-08-15

类型：发明专利

摘要

本发明提出了一种基于视觉语义数据增强的模型优化方法，用于改进视觉语义任务下的模型性能。本方法聚焦场景中的物体语义信息对模型的影响，首先利用预设的数据集评估模型表现，根据模型表现和场景数据，利用大语言模型总结关键的语义信息，再将这个语义信息注入到新产生的数据中，进而生成新的模型训练数据，并形成不断改进的循环。相比传统数据增强方法，本发明实现了数据增强过程与模型缺陷的匹配，以自动化的形式提供更适合提高模型性能的训练场景，可以用于视觉语义导航、视觉语言导航等多个具身任务。

技术关键词

模型优化方法语义大语言模型物体视觉关系数据更新训练数据量视角计算机可读存储介质训练场景优化装置分析模块决策列表定义

基于视觉语义数据增强的模型优化方法、装置和存储介质

站点导航

APP 下载