多媒体领域媒资查询任务的模型训练的数据合成方法

正文

推荐专利

申请号：CN202510137228

申请日期：2025-02-07

公开号：CN120046756A

公开日期：2025-05-27

类型：发明专利

摘要

本发明涉及多媒体领域的数据处理技术。一种多媒体领域媒资查询任务的模型训练的数据合成方法，其特征在于：首先获取基础查询语料的数据,采用LLM大语言模型，通过LLM对查询语料进行语义解析，提取关键特征，并根据多媒体检索场景生成多样化的查询用抽象模板；基于所述查询用抽象模板，将多媒体媒资库的媒资数据作为查询用抽象模板的实体对象进行结合扩充，生成新的查询语料数据，最后将新的查询语料数据作为训练数据用于媒资查询任务的模型训练。本发明利用了自动化和智能化的数据合成技术，有效降低了模型训练的成本；采用的生成模板方式具有极高的扩展性，能够适应不同领域和场景的媒资查询任务，提供了精准控制和高度可定制化的能力。

技术关键词

多媒体抽象模板数据字大语言模型生成方式场景实体对象关键字生成模板数据处理技术定义语义频道语句音乐基础视频

系统为您推荐了相关专利信息

语言处理模型训练方法及装置、问题处理方法及装置

文本模型训练方法医学语义终端设备

一种信审对话模型的自学习方法

学习方法样本种子数据大语言模型

基于大语言模型与知识图谱的智能客服问答方法、装置、设备以及介质

智能客服问答方法大语言模型图谱关键词神经网络参数

文本多标签分类方法、分类装置、电子设备及存储介质

多标签分类方法大语言模型文本分类装置数据

一种基于大语言模型的项目进度自动汇总系统和方法

汇总系统大语言模型团队模块项目结构化信息

多媒体领域媒资查询任务的模型训练的数据合成方法

站点导航

APP 下载