用多模态大模型智能体对具备人机接口的设备进行泛用性的无侵入自动操作的方法

正文

推荐专利

申请号：CN202510743993

申请日期：2025-06-05

公开号：CN120669872A

公开日期：2025-09-19

类型：发明专利

摘要

本发明提供了一种用多模态大模型智能体对具备人机接口的设备进行泛用性的无侵入自动操作的方法，包括：步骤1，信号捕获：边缘设备获取目标设备的输出信号；步骤2，数据上传：边缘计算设备读取其视频流或者将步骤1采集的原始信号转换为可解析的数字信号，然后分割为独立屏幕截图并进行预处理，随后将处理后的截图及识别结果上传至服务器；步骤3，指令生成下发：服务器分析数据后生成后续操作指令，回传至边缘计算设备；步骤4：边缘计算设备将操作指令转化为具体HID信号，发送至目标设备，完成自动化操作闭环。本发明的有益效果是：本发明方法能通过与人类操作员完全相同的方式对目标设备进行自动控制，能应用于任何人类可操作的电子设备。

技术关键词

大语言模型服务器人机接口人机交互接口独立屏幕信息记忆模块信号指令坐标人机交互界面分辨率视频流文本交互组件控制面板对象识别标签像素

系统为您推荐了相关专利信息

一种大语言模型驱动GPT小模型的智能文本多标签方法

文本大语言模型多标签语义检索模型训练集

一种基于大语言模型和规则的NL2SQL歧义消除方法

歧义消除方法大语言模型模式匹配句式结构交互式用户界面

一种车辆OTA差分升级方法、装置及系统

差分升级方法固件还原算法云端服务器升级装置

基于秘密分享和差分隐私的安全高效联邦学习方法及系统

客户端联邦学习方法差分隐私服务器梯度下降算法

基于指令语义增强的高性能计算设备错误弹性预测方法

高性能语义数据依赖关系故障注入工具多头注意力机制

用多模态大模型智能体对具备人机接口的设备进行泛用性的无侵入自动操作的方法

站点导航

APP 下载