基于半结构化文本信息的指代表达理解方法

正文

推荐专利

基于半结构化文本信息的指代表达理解方法

申请号：CN202510134670

申请日期：2025-02-07

公开号：CN120106042B

公开日期：2025-12-23

类型：发明专利

摘要

本发明的基于半结构化文本信息的指代表达理解方法是通过对图像和文本进行特征提取，分别获取图像特征和文本特征；通过软切分模块对中文本特征进行处理，将文本特征切分为主语主导的文本编码和上下文主导的文本编码；在多模态Transformer融合模块中，计算图像特征和文本特征之间的相似度矩阵，生成多模态表征；基于此特征，通过渐进式推理模块分别进行两次框预测，每次预测生成预测框，计算预测框与标签框之间的绝对误差损失和广义交并比损失，并将绝对误差损失和广义交并比损失线性组合，形成优化函数，通并通过优化函数调整模型参数。该方法在多个基准数据集上显著提升了视觉定位的准确性和鲁棒性，为复杂语言查询的理解提供了高效解决方案。

技术关键词

半结构化文本多模态信息融合标签框特征值表达式编码广义 BERT模型矩阵模型预测值图像多层感知机模块参数注意力机制视觉解析器

系统为您推荐了相关专利信息

一种基层沥青路面监测方法及系统

沥青路面监测方法监测系统管理策略指数

一种基于机械脉冲激振的瓷绝缘子带电检测方法及系统

带电检测方法 BP神经网络模型声纹特征判断绝缘子绝缘子带电检测系统

一种建筑工程管理系统及其管理方法

编码向量建筑工程管理系统身份语义特征决策

基于高斯烟流修正的内陆核电源项扩散计算方法及系统

数值天气预报计算方法软件调用系统编程放射性核素浓度

基于生成式AI的聚合反应温度优化方法及装置

强化学习策略导热油实时状态信息温度优化方法神经网络算法

基于半结构化文本信息的指代表达理解方法

站点导航

APP 下载