摘要
本公开提供一种智能交互方法,包括:接收用户输入的智能交互任务;获取用户交互界面的第一截图;识别所述第一截图上的至少一个可操作页面元素;为所述至少一个可操作页面元素分别分配操作序号;基于所述第一截图以及所述至少一个可操作页面元素的操作序号生成参考图像;基于所述智能交互任务以及所述至少一个可操作页面元素生成提示语;将所述提示语以及所述参考图像输入多模态大模型,由所述多模态大模型输出下一步的操作;以及调用系统调试工具执行所述操作,并返回所述获取用户交互界面的第一截图的步骤。本公开还提供了智能交互应用部署方法以及相关装置。
技术关键词
智能交互方法
调试工具
页面
多模态
元素
界面
计算机程序指令
分布式虚拟机
智能交互装置
图像
关键帧
布局
文本
计算机程序产品
模块
参数
处理器
脚本
系统为您推荐了相关专利信息
动态故障
矩阵
多任务损失函数
交互特征
诊断方法
项目管理系统
项目管理模块
元素
可视化单元
日志
健康状态预测方法
定位模块
多模态
数据
运动状态参数
视觉特征
实体
知识图谱融合方法
多模态特征
文本