摘要
本发明属于人机交互技术领域,公开了一种即插即用的桌面交互智能体模块及其交互方法,模块搭载嵌入式AI计算平台实现桌面交互,交互过程包括:利用HDMI采集卡获取桌面的GUI视图,使用麦克风获取语音指令并转换成指令文本;利用深度学习算法解析GUI视图,构建结构化的GUI视图文本表征;基于大语言模型分析交互意图,制定基于GUI控件的执行方案;通过USB接口与键鼠协议向计算机系统发送键鼠事件,实现交互的自主执行;本发明所述模块作为一种即插即用的外部设备,内部搭载了嵌入式AI计算平台,使得桌面交互智能体摆脱对计算机系统的网络、算力的依赖,不会为计算机系统造成额外的计算负担,有利于桌面交互智能体在现有计算机系统上的大规模落地应用。
技术关键词
桌面交互方法
USB接口
计算机系统
显示输出接口
深度学习算法
智能麦克风
大语言模型
平台
指令
深度神经网络模型
人机交互技术
视频采集卡
转换文本
控件
语法结构
事件流
系统为您推荐了相关专利信息
光子接收装置
分布反馈半导体激光器
宽带微波
深度学习算法
低噪声放大器
智能生成方法
生成规则
智能生成系统
人物特征
画像
表型分析方法
图像超分辨率重建
超分辨率重建图像
无人机
退化模型
柔性作业车间
智能调度方法
柔性车间作业调度
深度强化学习
微电网