一种高效文字转语音的方法及系统

正文

推荐专利

一种高效文字转语音的方法及系统

申请号：CN202411711013

申请日期：2024-11-27

公开号：CN119207374B

公开日期：2025-02-07

类型：发明专利

摘要

本申请提供一种高效文字转语音的方法及系统。其中，接收用户输入的文本信息，识别并分析所述文本信息中的情感色彩和语气特征；根据所述情感色彩和所述语气特征，从预先构建的情感语音库中选择相匹配的基础语音片段的数据集；利用动态时间规整算法调整所述基础语音片段的时间轴，使所述基础语音片段的时间轴与所述文本信息的语速相适应的同时保持所述情感色彩的一致性；采用频谱融合技术，将调整后的时间轴与所述文本信息的音素序列进行融合，生成语音输出，其中，所述频谱融合技术用以确保不同的情感色彩的基础语音片段在连接处平滑过渡。本申请提供的技术方案提高了语音合成的情感表达能力、自然度和连贯性，从而大幅提升了用户体验。

技术关键词

情感特征动态时间规整算法文本色彩基础生成语音递归神经网络模型频谱特征存储组件标签卷积神经网络模型长短期记忆网络谐波结构计算机存储介质序列定义注意力机制自然语言

字幕生成方法文本图像变换器遥感图像数据视觉特征

一种基于大模型的联网知识问答及安全检测系统及方法

文本分类模型编码转换技术词法分析工具识别网络流量知识问答系统

一种大坝岸坡变形趋势预警排查方法、系统及预警装置

排查方法三维变形场预警模型动态时间规整算法大坝

基于模态融合和自进化微调的信息驱动目标分割方法

融合视觉特征分割方法适配器图像编码器代表

一种非结构化数据的检索方法、装置、设备及可读介质

数据检索系统网关检索方法存储库循环神经网络模型

一种高效文字转语音的方法及系统

站点导航

APP 下载