一种合成语音生成方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
一种合成语音生成方法、装置、计算机设备及存储介质
申请号:CN202510726460
申请日期:2025-05-30
公开号:CN120544538A
公开日期:2025-08-26
类型:发明专利
摘要
本申请属于人工智能技术领域,适用于金融或医疗领域,涉及一种合成语音生成方法、装置、计算机设备及存储介质,该方法包括:获取用户终端发送的合成语音生成请求,其中,所述合成语音生成请求包括待合成文本数据、待合成语音数据以及文本标记位置数据;将所述待合成文本数据输入至XLM编码器进行文本编码操作,得到XLM标记嵌入数据;对所述待合成语音数据进行下采样操作,得到下采样注册标记数据;将所述文本标记位置数据输入至位置编码器进行位置编码操作,得到标记位置嵌入数据;将所述XLM标记嵌入数据、所述下采样注册标记数据以及所述标记位置嵌入数据输入至音频Transformer模型进行音频预测操作,得到音频预测数据。本申请可以有效减少对标注数据的依赖。
技术关键词
语音生成方法 数据 标记 计算机可读指令 文本 语音编码 位置编码器 音频采样 计算机设备 解码器 采样模块 编码模块 生成装置 可读存储介质 音频解码 人工智能技术
系统为您推荐了相关专利信息
1
产品推荐方法、产品推荐模型的训练方法、装置及设备
产品推荐方法 标签 计算机执行指令 数据获取模块 产品推荐装置
2
数据插补方法、装置、电子设备和计算机可读存储介质
特征污染物 数据插补方法 数据缺失值 双向长短期记忆 水质
3
一种基于深度神经网络的冷链气调机氮氧浓度调节方法
浓度调节方法 深度神经网络 补气阀门 历史运行数据 位置编码单元
4
一种计算机辅助的抗滑桩与锚索嵌固深度设计方法
深度设计方法 三维地质模型 分块 边坡 优化约束条件
5
一种基于北斗技术的无人机动态路径规划的方法及系统
动态路径规划 北斗技术 无人机 北斗卫星导航接收机 卫星导航解算
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号