摘要
本申请公开了一种语音合成方法、装置、存储介质和电子设备,涉及金融科技领域。该方法包括:获取待处理文本,其中,待处理文本包括描述N个对象之间的交互行为的文本,N大于1;在待处理文本中,识别出N个对象各自的对话文本,确定M段对话文本,其中,M大于1;根据M段对话文本各自的上下文,分别确定M段对话文本各自的语调和/或M段对话文本各自的语速;根据M段对话文本各自的语调和/或M段对话文本各自的语速,基于N个对象各自的基础声线分别采用N个虚拟数字人播报M段对话文本。通过本申请,解决了相关技术中由于语音合成声线单一造成的场景及对话信息传递不完整的技术问题。
技术关键词
文本
非易失性存储介质
对象
音频
神经网络模型训练
语音
基础
电子设备
策略
计算机程序产品
处理器
自然语言
样本
识别模块
存储器
指令
系统为您推荐了相关专利信息
学生
咨询平台
触摸显示屏
咨询管理系统
管理方法
机器狗
手势控制
视频采集设备
输入神经网络模型
对象跟踪
交付方法
代码仓库
多模态
批量数据
hash算法
海洋产业
企业经营范围
分类识别方法
企业信用信息
样本