摘要
本发明公开了一种面向具身智能场景的多轮人机对话需求澄清方法,属于人机交互技术领域;方法为:接收用户的自然语言初始指令,并将指令内容与实时的多模态上下文信息进行初步融合;通过歧义检测模块,评估当前指令是否满足任务执行的完备性条件;整合初始指令及所有交互轮次中获取的全部信息,形成最终任务意图;采用结构化的行动计划,对最终任务意图进行解析至完成任务。本发明通过多模态情境融合机制与结构化歧义检测模块,解决因缺乏真实世界感知、依赖预设模板而导致的意图理解浅显、无法处理未知模糊指令的难题;利用大语言模型生成任务必要参数清单,将不明确的指令量化为具体的缺失要素,提升了对用户真实意图的理解深度与准确性。
技术关键词
澄清方法
意图
指令
自然语言
执行控制器
文本
场景
参数
闭环反馈机制
人机交互技术
交互历史
对象定位
检索算法
多模态
列表
大语言模型
模板
决策
任务调度
状态更新
系统为您推荐了相关专利信息
图像嵌入
变换器
文本编码器
可读存储介质
计算机
调度控制策略
资源调度策略
设备控制指令
新能源发电设备
计划
效率预测方法
皮尔逊相关系数
飞灰
层次聚类算法
Fe2O3含量
数据集构建方法
视觉推理
答案
大语言模型
文本区域检测