基于图形界面的多模态用户任务智能决策与执行方法

正文

推荐专利

申请号：CN202510771870

申请日期：2025-06-10

公开号：CN120723305A

公开日期：2025-09-30

类型：发明专利

摘要

本申请涉及人机交互技术领域，尤其涉及一种基于图形界面的多模态用户任务智能决策与执行方法，获取用户任务输入并采集当前设备图形界面及历史规划记录，构建多模态输入集合；基于多模态输入集合调用规划Agent进行用户任务理解与全局规划，输出思考内容、全局规划以及下一步计划，调用指令Agent接收来自规划Agent的下一步计划，将操作指令翻译成控制指令并输出；执行指令Agent输出的控制指令，并反馈执行结果；根据任务未完成状态，返回规划Agent进行新的全局规划和下一步计划推理。重复进行任务理解、全局规划以及下一步计划的执行，直到全局规划完成。本申请能提升任务在实际图形界面上的执行准确性、连续性与鲁棒性。

技术关键词

规划计划多模态指令决策建立映射关系人机交互技术界面模块控制接口驱动设备程序自然语言处理器设备端操作系统阶段可读存储介质存储器鲁棒性

系统为您推荐了相关专利信息

一种基于CGE模型的经管虚拟仿真实验教学系统及方法

虚拟仿真实验教学 CGE模型团队企业模块

基于对话系统的转发方案生成方法、装置、设备及介质

对话系统生成方法存储单元生成算法标识

建筑施工场地节能用电系统及其控制方法

节能用电系统建筑施工场地分布式电源出力施工设备负荷

一种动作识别方法、装置、计算机设备及存储介质

动作识别方法空间注意力网络图片动作识别模型注意力机制

磁感应强度的计算方法、装置、存储介质及计算机设备

磁感应强度样本参数三维仿真模型磁铁设计技术

基于图形界面的多模态用户任务智能决策与执行方法

站点导航

APP 下载