摘要
本申请涉及端侧模型部署的技术领域,尤其涉及一种端侧语音模型部署方法、装置、设备及存储介质。包括:端侧录制的参考音频;提取参考音频的参考语义令牌和嵌入向量;获取训练文本集,将训练文本集中每一训练文本对应的训练文本编码、嵌入向量和参考语义令牌整合输入至预设语言模型,输出对应训练文本的综合令牌序列;对每一综合令牌序列执行梅尔频谱转换,得到对应综合令牌序列的第一频谱表示;根据每一第一频谱表示生成对应训练文本的音频信号,整合得到训练数据集;将训练数据集输入至待训练模型,训练得到仅保留音色建模参数的轻量语音模型;将轻量语音模型更新至端侧完成端侧部署。本申请可以实现对端侧设备的语音合成模型部署。
技术关键词
模型部署方法
令牌
语音
语义
文本
音频
序列
位置编码器
云端服务器
音色特征
解码单元
生成上下文感知
频谱特征
模型更新
设备通信
标识符
参数
信号
系统为您推荐了相关专利信息
风险主体
风险评分模型
风险量化评估方法
舆情文本
网络
智能雷达
雷达设备
电脑输入输出设备
人机交互系统
显示设备模块