摘要
本公开的实施例提供了用于业务处理的方法、装置、设备和存储介质。该方法包括:获取业务描述信息和目标应用的目标页面的图像;基于业务描述信息、图像以及参考文档,确定在目标页面上执行相关操作的执行策略,参考文档指示应用的页面所包含的元素的功能和与元素进行交互的交互结果;以及基于执行策略,在目标页面上执行相关操作。以此方式,可以改善自动化代理的灵活性、适应性以及跨应用能力较差的问题。
技术关键词
页面
大语言模型
计算机可执行指令
处理单元
元素
策略
图像
样本
计算机程序产品
电子设备
意图
可读存储介质
存储器
处理器
视频
模块
文本
系统为您推荐了相关专利信息
LED芯片
半导体发光元件
周期性结构
半导体层
应力释放层
地图标绘方法
交互式地图
大语言模型
矢量道路
执行冲突检测
噪声预测器
预定噪声
图像解码器
计算机可执行指令
文本编码器