摘要
本发明属于人工智能技术领域,涉及一种基于大模型智能体的安卓手机智能操控方法和系统,所述方法包括:1)获取用户输入的任务;2)判断用户输入的任务是否在Agent模型的处理范围之内,如果是,则进入步骤3),否则,结束用户输入的任务的执行;3)获取安卓手机的页面信息;4)进行页面非标准状态的判断处理;5)对获取到的页面XML进行压缩化简及页面补全处理;6)将处理后的页面XML和页面截图输入Agent模型中,由Agent模型输出安卓手机下一步执行的操作类型和位置;7)根据Agent模型的输出,基于无障碍服务AccessibilityService对安卓手机进行操作执行。其能够对手机页面状态进行识别判断,结合用户意图对操作进行规划执行。
技术关键词
智能操控方法
智能体模型
光学字符识别方法
手机
节点
Agent模型
删除页面
智能操控设备
文本
智能操控系统
分辨率
序列
人工智能技术
数据获取模块
数据处理模块
处理器
信息处理
系统为您推荐了相关专利信息
分布参数系统
宽厚板
热加工炉
误差系统
火焰喷嘴
数字化管理系统
大数据分析模型
订单
可视化窗口
数据分析单元
点云图像
全局地图
位姿变化量
停车场地图
关键帧
斜拉桥斜拉索
状态评价方法
无人机
全局平均池化
批量