一种基于思维链微调大模型的交通域服务语音自适应生成方法及系统

正文

推荐专利

申请号：CN202510604879

申请日期：2025-05-12

公开号：CN120126484B

公开日期：2025-07-22

类型：发明专利

摘要

本发明公开了一种基于思维链微调大模型的交通域服务语音自适应生成方法及系统，首先利用语音编码器将输入语音信号转化为高维语音特征信号，再通过文字解码器和拼音解码器根据高维语音特征信号生成文本输出信号；本发明实现了具有采用变分去量化联合数据增强机制、双通道多模态判别器架构及分层复合损失函数进行高保真情感语音生成与复杂噪声环境下的鲁棒性合成并同步支持语义驱动的动态韵律优化与专业术语精准发音的功能，且在交通领域应用场景中能采用多任务语音识别法实现字符级识别、音频转拼音及句子级口音分类模块的高效联动从而有效应对口音复杂和杂音多及交通术语多音字挑战，适合被广泛推个和使用。

技术关键词

语音编码器语音识别模型解码器语音特征拼音声学特征多任务生成方法交通文本信号声码器矩阵音频特征多模态前馈神经网络数据语音识别模块

系统为您推荐了相关专利信息

电芯检测方法、电子设备及电芯检测设备

电芯检测方法图像获取装置电芯检测设备对象电子设备

一种基于RGNN-Crossformer融合架构的产业链金融风险预测方法

函数型数据分析证券交易所集成电路产业链编码器企业关联关系信息

一种基于编解码器双聚焦的树高和生物量协同反演方法、系统、设备及介质

合成孔径雷达数据协同反演方法残差模块星载激光雷达多任务学习模型

基于生成式反事实解释的造影图像智能分析方法及系统

图像智能分析方法造影剂上采样动态生成对抗网络

一种情绪感知及干预系统、方法、装置和机器人

数据处理模块识别模块干预方法语音情绪分析语音情感分析

一种基于思维链微调大模型的交通域服务语音自适应生成方法及系统

站点导航

APP 下载