一种基于大模型的实时语音交互方法及系统

正文

推荐专利

一种基于大模型的实时语音交互方法及系统

申请号：CN202511136462

申请日期：2025-08-14

公开号：CN120853551A

公开日期：2025-10-28

类型：发明专利

摘要

本发明提供一种基于大模型的实时语音交互方法及系统，采集用户的多轮历史对话数据，能够对上下文进行深度理解，根据历史对话内容演进调整后续的策略。通过动态上下文的精准构建和大模型的强大语义理解能力，系统能更好地理解用户意图和对话逻辑，生成的回复更符合人类语言习惯，大幅提升了交互自然度。基于强化学习算法和人类反馈对大模型的智能决策进行优化，使得大模型能在实时交互中不断学习，根据用户反馈和对话进展调整回复策略，提高回复的相关性、连贯性和用户满意度。通过设置打断机制，在实时语音交互过程中，能够有效处理用户的打断意图，保证了实时语音交互的有效性，以此提高实时语音交互的准确性与流畅性。

技术关键词

动态上下文实时语音交互方法音频特征文本强化学习算法韵律特征 MFCC特征场景策略意图画像文档型数据库交互系统强化学习框架滑动窗口机制人类融合特征

系统为您推荐了相关专利信息

智能问答方法、装置、设备及介质

智能问答方法多轮对话文本互联网意图

基于条件信息流最大化的大模型内容安全检测方法及系统

预训练语言模型线性分类器最大化准则文本对抗性

一种基于标签置信度加权的目标级句子简化方法及系统

简化方法分类器标签数据简化系统

一种基于大模型的问答方法及设备

文本问答方法意图语义特征检索算法

网页篡改的监测方法、计算机程序产品、设备及存储介质

语义分析模型文本历史页面快照 Word2Vec模型

一种基于大模型的实时语音交互方法及系统

站点导航

APP 下载