模型训练方法、数据处理方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202410830602

申请日期：2024-06-25

公开号：CN118606896A

公开日期：2024-09-06

类型：发明专利

摘要

本发明公开了一种多模态数据处理模型的训练方法，包括：获取第一训练样本数据集，所述第一训练样本数据集由若干音频数据组成；通过所述第一训练样本数据集训练第一数据处理模型，获得预训练的第一数据处理模型；获取第二训练样本数据集，所述第二训练样本数据集包括：音频数据、文本数据、音频与文本混合数据；基于所述预训练的第一数据处理模型构建所述多模态数据处理模型，通过所述第二训练样本数据集对所述多模态数据处理模型进行端到端的训练，获得目标多模态数据处理模型。通过应用本方案，可以实现端到端的多模态数据处理模型的训练，避免现有技术中通过多个独立模块组合成的模型在处理数据过程中错误累积的问题。

技术关键词

数据处理模型训练样本数据多模态音频解码单元特征提取模型标识符生成样本数据特征提取器文本数据处理方法嵌入特征数据处理装置编码声学特征语义特征模型训练方法数据处理单元

系统为您推荐了相关专利信息

一种基于物联网的高速公路服务区污水处理系统

高速公路服务区污水处理方法溶解氧水质 LSTM模型

基于人工智能的医疗辅助诊断系统、装置

辅助诊断系统病历异常数据点聚类可视化框架

一种异常耳廓形态数据模型构建方法及系统

数据模型构建方法形态融合策略多模态机制

驾驶员疲劳驾驶干预方法、设备、存储介质及程序产品

驾驶环境信息状态监测数据大语言模型驾驶员疲劳驾驶策略

面向AIGC的云边协同算力加速优化方法及平台

反馈特征交互特征多模态节点云端

模型训练方法、数据处理方法、装置、设备及存储介质

站点导航

APP 下载