端侧语音模型部署方法、装置、设备及存储介质

AITNT
未登录
正文
推荐专利
端侧语音模型部署方法、装置、设备及存储介质
申请号:CN202511203841
申请日期:2025-08-27
公开号:CN120808761A
公开日期:2025-10-17
类型:发明专利
摘要
本申请涉及端侧模型部署的技术领域,尤其涉及一种端侧语音模型部署方法、装置、设备及存储介质。包括:端侧录制的参考音频;提取参考音频的参考语义令牌和嵌入向量;获取训练文本集,将训练文本集中每一训练文本对应的训练文本编码、嵌入向量和参考语义令牌整合输入至预设语言模型,输出对应训练文本的综合令牌序列;对每一综合令牌序列执行梅尔频谱转换,得到对应综合令牌序列的第一频谱表示;根据每一第一频谱表示生成对应训练文本的音频信号,整合得到训练数据集;将训练数据集输入至待训练模型,训练得到仅保留音色建模参数的轻量语音模型;将轻量语音模型更新至端侧完成端侧部署。本申请可以实现对端侧设备的语音合成模型部署。
技术关键词
模型部署方法 令牌 语音 语义 文本 音频 序列 位置编码器 云端服务器 音色特征 解码单元 生成上下文感知 频谱特征 模型更新 设备通信 标识符 参数 信号
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号