一种场景理解信息生成方法、装置、设备及介质

正文

推荐专利

申请号：CN202411376899

申请日期：2024-09-30

公开号：CN119251657A

公开日期：2025-01-03

类型：发明专利

摘要

本申请公开了一种场景理解信息生成方法、装置、设备及介质，包括：将图像输入场景分类模型，得到场景分类模型输出的图像对应的场景类型；利用目标检测模型识别图像中的目标对象，得到目标对象信息，其中，目标对象信息包括目标类型以及位置信息，目标类型包括物体和人员；基于人员属性识别模型识别图像中人员的目标属性信息；将场景类型、目标对象信息、目标属性信息作为上下文信息，并基于上下文信息与用户输入文本确定模型输入信息；将模型输入信息输入自然语言处理模型，以使自然语言处理模型基于上下文信息的提示生成图像对应的场景理解信息。这样，提升了对场景的感知能力，生成更为准确的场景理解信息，从而提升用户体验。

技术关键词

属性识别模型信息生成方法场景分类对象自然语言图像训练样本关键点特征信息生成装置卷积模块文本处理器物体识别模块可读存储介质存储器电子设备

系统为您推荐了相关专利信息

保险条款划分方法及装置、电子设备、存储介质

强化学习模型拓扑网络数据决策划分方法

一种用于围手术期患者会诊意见的自动化生成方法

自动化生成方法围手术期患者门控循环单元风险神经网络深度学习

一种基于云计算的企业大数据分析处理方法和系统

虚拟私有云访问控制策略分布式计算框架数据一致性校验扩展算法

一种基于插件的知识服务外挂集成方法、系统及存储介质

集成方法插件外挂业务系统令牌

人机对话方法、设备、存储介质及程序产品

知识点人机对话方法专业答案大语言模型

一种场景理解信息生成方法、装置、设备及介质

站点导航

APP 下载