一种基于深度学习的智能机器人语音合成方法

AITNT
正文
推荐专利
一种基于深度学习的智能机器人语音合成方法
申请号:CN202411625436
申请日期:2024-11-14
公开号:CN119446117B
公开日期:2025-08-22
类型:发明专利
摘要
本发明涉及智能语音合成技术领域,公开一种基于深度学习的智能机器人语音合成方法,包括:步骤1、文本处理:接收输入文本,且对文本进行分词、词性标注和音素标注,得到文本嵌入序列,用于后续的情感分析步骤;步骤2、情感分析:根据生成的文本嵌入序列,使用基于BERT的情感分类模型对文本进行情感分析,得到文本情感嵌入,用于多模态情感融合;步骤3、接收视觉输入,通过卷积神经网络提取视觉情感嵌入,且将视觉情感嵌入输入到多模态情感融合中。通过深度学习模型能学习语音数据,提取出语音中的自然音素、语调和节奏特征,生成自然流畅的语音合成效果,能在语速、语调和音质上贴近人类语音,而增强用户的听觉体验。
技术关键词
文本 智能机器人 多模态 声谱 视觉 卷积神经网络提取 语音 情感分类模型 BERT模型 声码器 情感类别 语义向量 控制接口 卷积神经网络模型 音频 半监督训练 情感分类器 数据 生成方法 生成对抗网络
系统为您推荐了相关专利信息
1
一种基于知识图谱的领域内模型训练方法和系统
模型训练方法 大语言模型 知识图谱构建 实体 生成模板
2
基于图关系挖掘的无障碍众包代表性页面采样方法
采样方法 节点 聚类 文档对象模型 多维特征向量
3
扫地机器人的覆盖率测试方法、测试系统、存储介质及计算机程序产品
覆盖率测试方法 无线定位基站 二维码标签 计算机程序产品 轨迹
4
一种基于多正样本匹配的多模态对比学习遥感分类方法
遥感分类方法 激光雷达数据 高层语义特征 融合特征 样本
5
基于条件多模态提示的机器人精细化目标定位方法及装置
视觉特征 机器人 多模态 定位方法 编码
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号