基于大语言模型的智能体定位图像元素的方法及装置

正文

推荐专利

申请号：CN202510083162

申请日期：2025-01-20

公开号：CN119992549A

公开日期：2025-05-13

类型：发明专利

摘要

本发明公开了基于大语言模型的智能体定位图像元素的方法及装置。该方法包括：获取用户基于预设模板图像输入的元素标记指令，并基于元素标记指令确定预设模板图像对应的目标图像元素；基于预设语义大模型对目标图像元素进行图像语义分析，生成目标图像元素对应的基础语义结果；基于预设语法模板集合填充处理基础语义结果，生成目标图像元素对应的基础语言描述结果；基于预设语义大模型及基础语言描述结果在目标显示图像中确定目标图像元素对应的目标语言描述结果。通过本发明的技术方案，能够实现对捕获的图像元素进行图像语义分析，实现图像元素定位，提高了图像元素的定位效率及准确率。

技术关键词

图像语义分析元素大语言模型基础模板视觉特征语义分析算法指令标记特征提取算法词典处理器可读存储介质检查规则解析算法计算机生成规则电子设备

系统为您推荐了相关专利信息

一种智能仰卧起坐训练管理系统及其应用方法

智能仰卧起坐训练管理系统仰卧起坐训练器人脸智能终端

一种无状态的轻量级跨靶场网络控制方法与系统

网络控制方法网关网络连接配置三元组虚拟机实例

一种基于BIM的工程项目进度管控方法及系统

进度管控方法物联网传感器网络风险多源特征工程项目进度管理技术

基于多源数据分析的停车资源智能调度系统

智能调度系统动态实时数据策略算法车辆实时位置

一种基于活动水平预测的S/IVOCs未来排放清单构建方法

灰色预测模型多元线性回归模型置信区间估计排放量数据

基于大语言模型的智能体定位图像元素的方法及装置

站点导航

APP 下载