一种数字人语音交互优化方法及系统

正文

推荐专利

一种数字人语音交互优化方法及系统

申请号：CN202510085183

申请日期：2025-01-20

公开号：CN119943045A

公开日期：2025-05-06

类型：发明专利

摘要

本发明涉及数字人技术领域，公开了一种数字人语音交互优化方法及系统，通过预训练的语音识别模型获取用户的实时语音流，得到实时语音流的文字识别结果；将文字识别结果输入预训练的大语言模型，生成回答文本；将回答文本通过预训练的语音合成模型合成回答语音流；根据语音识别模型的识别延迟判断是否需要添加语气词；根据当前对话的上下文通过预训练的上下文感知模型选择目标语气词，并将目标语气词插入回答语音流的最前端，得到更新后的回答语音流；将回答语音流通过音频输出模块进行实时播放，实现数字人的语音交互。本发明能够降低用户对延迟的感知，提升系统的响应速度，使得语音交互更加自然、流畅，提升用户使用体验。

技术关键词

实时语音交互优化方法语音识别模型音频输出模块文本语音识别模块深度学习模型系统实时监控负载均衡算法构建知识图谱波形识别策略实体提升系统核心关系编码

系统为您推荐了相关专利信息

军事领域图谱的实体链接模型的训练数据构造方法及系统

实体链接模型数据构造方法生成训练数据采集平台军事

一种基于大语言模型的工单自动生成方法和系统

关键词自动生成方法大语言模型文本实体

一种面向大语言模型的增量模型合并方法和系统

模型合并方法掩码矩阵大语言模型预训练模型参数

基于语言引导网络的密集人群计数方法

计数方法图像编码器样本文本编码器密度

大语言模型和小语言模型协同的民生诉求事件分拨方法

大语言模型语义检索模型数值信息处理技术系列

一种数字人语音交互优化方法及系统

站点导航

APP 下载