基于文本语音相关性判别生成动作序列的大模型训练方法

正文

推荐专利

申请号：CN202411438818

申请日期：2024-10-15

公开号：CN119478154A

公开日期：2025-02-18

类型：发明专利

摘要

本申请提出一种基于文本语音相关性判别生成动作序列的大模型训练方法，包括：获取目标语义特征，目标语义特征为同一文本内容对应的文本语义特征和语音语义特征融合生成的；将所述目标语义特征输入至多模态融合特征生成模型，输出对应的动作序列；基于所述目标语义特征和所述动作序列，计算所述多模态融合特征生成模型的损失函数值；基于所述损失函数值调整所述多模态融合特征生成模型的模型参数值，继续训练，直到满足预设的训练完成条件，得到训练好的多模态融合特征生成模型。本申请实施例通过利用同一文本内容对应的文本语义特征和语音语义特征融合生成的语义特征指导人体说话动作的生成，从而输出自然流畅合理的人体动画。

技术关键词

语义特征融合特征文本语音模型训练方法多模态动作序列生成方法生成动作解码器处理器可读存储介质存储器编码器电子设备人体动画计算机策略

系统为您推荐了相关专利信息

基于多模态大语言模型的芯片时序图标注方法及装置

大语言模型标注方法文本多模态信号线

一种心肺复苏的自动教学方法、系统、设备、介质及产品

自动教学系统自动教学方法视频监控模块深度学习算法人体骨架

基于大模型的交通数据分析方法、装置及计算机程序产品

分析组件交通数据分析方法意图实体数据接口

一种基于多模态协同学习框架的重识别模型训练方法及系统

可见光图像红外光识别模型训练方法行人重识别模型语义

自适应类别平衡的胎儿心脏超声图像半监督分类系统

胎儿心脏超声影像数据图像半监督分类融合特征误差

基于文本语音相关性判别生成动作序列的大模型训练方法

站点导航

APP 下载