端侧语音模型部署方法、装置、设备及存储介质

AITNT
正文
推荐专利
端侧语音模型部署方法、装置、设备及存储介质
申请号:CN202511203841
申请日期:2025-08-27
公开号:CN120808761A
公开日期:2025-10-17
类型:发明专利
摘要
本申请涉及端侧模型部署的技术领域,尤其涉及一种端侧语音模型部署方法、装置、设备及存储介质。包括:端侧录制的参考音频;提取参考音频的参考语义令牌和嵌入向量;获取训练文本集,将训练文本集中每一训练文本对应的训练文本编码、嵌入向量和参考语义令牌整合输入至预设语言模型,输出对应训练文本的综合令牌序列;对每一综合令牌序列执行梅尔频谱转换,得到对应综合令牌序列的第一频谱表示;根据每一第一频谱表示生成对应训练文本的音频信号,整合得到训练数据集;将训练数据集输入至待训练模型,训练得到仅保留音色建模参数的轻量语音模型;将轻量语音模型更新至端侧完成端侧部署。本申请可以实现对端侧设备的语音合成模型部署。
技术关键词
模型部署方法 令牌 语音 语义 文本 音频 序列 位置编码器 云端服务器 音色特征 解码单元 生成上下文感知 频谱特征 模型更新 设备通信 标识符 参数 信号
系统为您推荐了相关专利信息
1
一种图片素材自动扩展的方法、装置、设备及介质
图片 序列 视频 噪声强度 编码向量
2
一种基于主体关联网络的风险量化评估方法及系统
风险主体 风险评分模型 风险量化评估方法 舆情文本 网络
3
用于RAG系统的基于动态字段构建向量化知识库的方法
字段 文本 动态 索引 覆盖率
4
一种基于自主控制的智能雷达席位人机交互系统及交互方法
智能雷达 雷达设备 电脑输入输出设备 人机交互系统 显示设备模块
5
一种基于偏振三维感知的RGB与偏振图像融合语义分割方法和系统
融合语义分割 分支 多模态特征融合 图像 编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号