一种基于音色与情感模拟的数据输出方法及系统

正文

推荐专利

申请号：CN202411739469

申请日期：2024-11-29

公开号：CN119694349B

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于音色与情感模拟的数据输出方法及系统，涉及数据处理技术领域，包括：接收角色扮演数据和音色数据，对角色扮演数据和音色数据进行预处理，得到角色扮演数据集和音色数据集；将角色扮演数据集输入至预先建立的llama3模型内进行训练，输出得到角色扮演模型，将音色数据集输入至预先建立的GPT‑SoVITS模型内进行训练，输出得到音色模型；获取用户实时对话语音数据，对用户实时对话语音数据进行去杂声处理，基于CTC贪心搜索算法对处理的用户实时对话语音数据进行音素与汉字的转化，得到识别文本；将识别文本输入至预先建立的分词模型内，通过子词标记策略，采用字节对编码的方法，得到参数文件，将识别文本进行切片，将切片文本输入llama3模型内，结合参数文件进行预测，输出得到预测文本；将预测文本输入至音色模型内，得到语音输出结果，并将语音输出结果返回给用户。

技术关键词

数据输出方法文本分词模型搜索算法切片数据输出系统自动语音识别汉字模型训练模块标签处理器可读存储介质数据处理技术数据处理模块参数生成特征注意力机制随机噪声

一种基于音色与情感模拟的数据输出方法及系统

站点导航

APP 下载