多媒体领域媒资查询任务的模型训练的数据合成方法

AITNT
正文
推荐专利
多媒体领域媒资查询任务的模型训练的数据合成方法
申请号:CN202510137228
申请日期:2025-02-07
公开号:CN120046756A
公开日期:2025-05-27
类型:发明专利
摘要
本发明涉及多媒体领域的数据处理技术。一种多媒体领域媒资查询任务的模型训练的数据合成方法,其特征在于:首先获取基础查询语料的数据,采用LLM大语言模型,通过LLM对查询语料进行语义解析,提取关键特征,并根据多媒体检索场景生成多样化的查询用抽象模板;基于所述查询用抽象模板,将多媒体媒资库的媒资数据作为查询用抽象模板的实体对象进行结合扩充,生成新的查询语料数据,最后将新的查询语料数据作为训练数据用于媒资查询任务的模型训练。本发明利用了自动化和智能化的数据合成技术,有效降低了模型训练的成本;采用的生成模板方式具有极高的扩展性,能够适应不同领域和场景的媒资查询任务,提供了精准控制和高度可定制化的能力。
技术关键词
多媒体 抽象模板 数据字 大语言模型 生成方式 场景 实体 对象 关键字 生成模板 数据处理技术 定义 语义 频道 语句 音乐 基础 视频
系统为您推荐了相关专利信息
1
语言处理模型训练方法及装置、问题处理方法及装置
文本 模型训练方法 医学 语义 终端设备
2
一种信审对话模型的自学习方法
学习方法 样本 种子 数据 大语言模型
3
基于大语言模型与知识图谱的智能客服问答方法、装置、设备以及介质
智能客服问答方法 大语言模型 图谱 关键词 神经网络参数
4
文本多标签分类方法、分类装置、电子设备及存储介质
多标签分类方法 大语言模型 文本 分类装置 数据
5
一种基于大语言模型的项目进度自动汇总系统和方法
汇总系统 大语言模型 团队 模块 项目结构化信息
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号