摘要
本发明公开了在数字化身系统和应用中确定语音的情绪状态。在各种示例中,本文描述了在对话人工智能(AI)和/或数字化身系统和应用中确定语音的情绪状态。公开了使用一个或更多个机器学习模型来确定与语音相关联的一个或更多个情绪状态的系统和方法,其中机器学习模型可以使用各种过程进行训练。例如,在一些示例中,可以在第一训练过程中训练机器学习模型以确定值分布的概率,其中分布对不同的情绪状态建模。例如,分布可以包括表示愤怒的第一值、表示快乐的第二值、表示悲伤的第三值等。另外,或可替代地,在一些示例中,可以在第二训练过程中训练机器学习模型,以基于表示人类反馈的训练数据更精确地确定实际情绪状态(和/或概率)。
技术关键词
语音
音频
训练机器学习模型
虚拟现实内容
协作内容
处理器
感知系统
数字孪生
数据中心
视频
参数
控制系统
序列
机器人
资产
动画
电路
人类
系统为您推荐了相关专利信息
计算机可执行指令
自然语言理解技术
业务办理技术
业务办理效率
证件
识别语音信号
语音信号特征
实时语音
语音识别模型
识别系统
实时语音
传译方法
声学特征
文本
计算机可读指令