对话语音生成方法、装置、设备及介质

正文

推荐专利

对话语音生成方法、装置、设备及介质

申请号：CN202510696766

申请日期：2025-05-27

公开号：CN120375802A

公开日期：2025-07-25

类型：发明专利

摘要

本发明涉及人工智能技术领域，本方案可应用于金融、医疗领域，本发明提供了一种对话语音生成方法、装置、设备及介质，方法包括：利用大型语言模型将输入的文本摘要转换为具有多角色交互特征的对话式文本结构；为对话式文本结构中的每个代理角色分配唯一的标签特征；根据标签特征从预设语音库中自动匹配与各代理角色相符的声学特征参数；通过语音合成模型根据每个代理角色的声学特征参数将对话式文本结构转换为对话语音并进行输出。本发明实施例可将输入的文本摘要转换为具有多角色交互特征的对话式文本结构，满足听众对深度讨论和专业见解的需求，还可根据每个代理角色的声学特征参数将对话式文本结构转换为兼具内容深度和表现力的对话语音。

技术关键词

语音生成方法标签特征交互特征文本韵律特征参数摘要节目转换单元脚本处理器人工智能技术分配单元生成装置偏差风格可读存储介质关系存储器逻辑

系统为您推荐了相关专利信息

一种用于辅助语言学习的口语对话方法及其系统

词语口语对话方法文本分词音频

针对儿童神经发育类问题的知识库构建方法、设备及介质

知识库构建方法语义层级网络服务模块指标

基于强化学习的语音识别模型优化方法、装置、设备及介质

自动语音识别语音识别模型文本数据语义

用于图像处理的显示器、图像处理系统及图像处理方法

区域位置信息图像识别模块图像增强模块图像块输入接口

基于文本配置的页面生成方法、装置、电子设备及存储介质

页面文本信息页面生成方法标记可视化页面模型树

对话语音生成方法、装置、设备及介质

站点导航

APP 下载