端侧语音模型部署方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202511203841

申请日期：2025-08-27

公开号：CN120808761A

公开日期：2025-10-17

类型：发明专利

摘要

本申请涉及端侧模型部署的技术领域，尤其涉及一种端侧语音模型部署方法、装置、设备及存储介质。包括：端侧录制的参考音频；提取参考音频的参考语义令牌和嵌入向量；获取训练文本集，将训练文本集中每一训练文本对应的训练文本编码、嵌入向量和参考语义令牌整合输入至预设语言模型，输出对应训练文本的综合令牌序列；对每一综合令牌序列执行梅尔频谱转换，得到对应综合令牌序列的第一频谱表示；根据每一第一频谱表示生成对应训练文本的音频信号，整合得到训练数据集；将训练数据集输入至待训练模型，训练得到仅保留音色建模参数的轻量语音模型；将轻量语音模型更新至端侧完成端侧部署。本申请可以实现对端侧设备的语音合成模型部署。

技术关键词

模型部署方法令牌语音语义文本音频序列位置编码器云端服务器音色特征解码单元生成上下文感知频谱特征模型更新设备通信标识符参数信号

端侧语音模型部署方法、装置、设备及存储介质

站点导航

APP 下载