摘要
本发明公开了基于大模型的全场景任务自主执行方法及系统,属于计算机应用及人工智能技术领域,本发明要解决的技术问题为现有RPA技术缺乏自主思考能力,browser use技术适用范围受限、受网页变动等因素影响大,computer use技术操作不准确、开发难度高、存在安全风险,技术方案为:搭建MCP服务,并编写涵盖打开软件、启动浏览器、精准点击及信息填入的各类基础操作指令的任务自主执行工具集;在Windows虚拟机环境中部署MCP服务,确保服务稳定运行;构建具备理解、规划和调度任务能力的任务自主执行工作流智能体;接收用户输入的具体需求:用户通过自然语言输入任务目标,智能体接收并记录用户的具体需求,作为后续任务生成与执行的目标导向。
技术关键词
执行工作流
场景
充足存储空间
大语言模型
多模态
抓屏技术
防火墙策略
RPA技术
自然语言
列表
规划
可读存储介质
屏幕
人工智能技术
模态分析
处理器
坐标
参数
子模块
系统为您推荐了相关专利信息
水质预测方法
智能决策支持
多模态卷积神经网络
多模态数据融合
特征工程
实景三维重建方法
融合特征
多尺度特征提取
倾斜摄影数据
三维模型
智能预警方法
多模态数据采集
云端
时间同步
北斗时钟