摘要
本发明属于机器人与人类的语音交互技术领域,具体涉及一种具身语音交互方法及其系统。步骤1:智能体根据环境响度使得收音时长实现自适应;步骤2:设计大模型和小模型相互协同的多智能体框架;步骤3:基于步骤2设计的框架,将步骤1的收音进行分析,使用基于树状文档的检索增强技术,提升该智能体问答的可靠性,实现具身语音交互。本发明用以解决现有技术中的语音交互技术大多只能实现单轮交互、而不能记住交互的上下文内容,且直接将传统的语音交互技术移植到会移动的、自身发出噪声的机器人身上,则难以获取纯净的人声的问题。
技术关键词
语音交互方法
语音交互技术
语音识别模型
词嵌入模型
收音模块
框架
语音交互系统
决策
文本
可读存储介质
生成向量
大语言模型
树状结构
处理器
人类
机器人
计算机设备
下位机
程序
系统为您推荐了相关专利信息
多任务学习模型
自动分类方法
文本
物业管理系统
预训练语言模型
语音识别模型
连续语音识别
空调控制方法
时间序列特征
训练样本集
管理机器人
管理知识库
云端服务器
大语言模型
语音播放器
信息识别方法
语音特征
AR设备
语音识别模型
特征提取模型