摘要
本发明涉及多媒体领域的数据处理技术。一种多媒体领域媒资查询任务的模型训练的数据合成方法,其特征在于:首先获取基础查询语料的数据,采用LLM大语言模型,通过LLM对查询语料进行语义解析,提取关键特征,并根据多媒体检索场景生成多样化的查询用抽象模板;基于所述查询用抽象模板,将多媒体媒资库的媒资数据作为查询用抽象模板的实体对象进行结合扩充,生成新的查询语料数据,最后将新的查询语料数据作为训练数据用于媒资查询任务的模型训练。本发明利用了自动化和智能化的数据合成技术,有效降低了模型训练的成本;采用的生成模板方式具有极高的扩展性,能够适应不同领域和场景的媒资查询任务,提供了精准控制和高度可定制化的能力。
技术关键词
多媒体
抽象模板
数据字
大语言模型
生成方式
场景
实体
对象
关键字
生成模板
数据处理技术
定义
语义
频道
语句
音乐
基础
视频
系统为您推荐了相关专利信息
智能客服问答方法
大语言模型
图谱
关键词
神经网络参数