基于大模型的语音风格表达切换系统

正文

推荐专利

基于大模型的语音风格表达切换系统

申请号：CN202411919731

申请日期：2024-12-25

公开号：CN119360831B

公开日期：2025-04-18

类型：发明专利

摘要

本申请提供了一种基于大模型的语音风格表达切换系统，涉及智能语音交互领域，其采用基于人工智能的数据处理技术来对原始语音信号进行基于梅尔频谱特征的提取、分块和嵌入编码处理以得到原始语音梅尔谱图图块嵌入编码特征的序列，对目标语音风格的自然语言描述进行语义编码处理以得到目标语音风格语义编码特征，然后将所述原始语音梅尔谱图图块嵌入编码特征的序列和所述目标语音风格语义编码特征进行跨模态交互优化编码得到的特征输入到训练完成的端对端模型以生成风格切换语音信号。这样，能够精准理解用户需求，使得切换后的语音风格更符合用户期望，同时通过精细化的处理，有助于使得切换后的语音风格更加自然流畅。

技术关键词

风格编码向量切换系统跨模态序列编码特征语义频谱特征提取信号分析模块自然语言数据采集模块智能语音交互分块数据处理技术麦克风

系统为您推荐了相关专利信息

一种基于深度强化学习的视觉刺激多分类方法与系统

多分类方法深度强化学习算法时间段视觉特征策略

一种预测结核病发病率的组合模型的构建方法

SVR模型 Akaike信息准则数据搜索算法混合预测模型

一种支持多主题的电力市场人机web框架实现方法及系统

web框架主题风格电力页面

一种用于蜂巢状智能电网的故障检测优化方法

序列智能电网故障检测分解算法蜂巢状

分布式储热装置的能量管理系统及方法

编码向量储热装置时序能量管理方法序列

基于大模型的语音风格表达切换系统

站点导航

APP 下载