多模态大模型的销售助手产品文档结构识别方法、系统

正文

推荐专利

申请号：CN202411528841

申请日期：2024-10-30

公开号：CN119763127A

公开日期：2025-04-04

类型：发明专利

摘要

本申请涉及多模态大模型技术领域，尤其涉及多模态大模型的销售助手产品文档结构识别方法、系统。通过获取待识别的销售助手产品文档信息；将获取待识别的销售助手产品文档信息，输入预先设置的多模态模型，输出识别后的销售助手产品文档信息。可以理解的是，本发明提供的技术方案，利用多模态大模型同时利用文本和视觉信息，同时利用文字和视觉信息进行文档结构识别，识别效果优异；另外，可以降低对标注数据量的依赖，同时新场景迁移成本低；可以生成模型端到端方案，同时生成内容块位置、类型、阅读顺序，通过提出生成式损失和区域框回归损失结合的多任务损失，弥补生成式损失的局限性。

技术关键词

视觉特征信息结构识别方法视觉特征提取多模态对齐模块特征提取器文本识别系统多任务表达式图像标签坐标场景序列

系统为您推荐了相关专利信息

一种基于多模态数据的数字孪生系统及构建方法

数字孪生系统活动推荐系统出行技术交互系统设计仿真环境

一种马铃薯育种用的监测分析系统及方法

马铃薯育种监测分析系统多模态数据采集监测分析方法多光谱成像装置

一种慢性Doc患者分级诊断方法及系统

诊断方法深度学习模型患者协方差矩阵深度学习优化

面向目标航天器监测的小型航天器轨迹多目标优化方法

小型航天器多模态传感器二维图像数据三维点云数据分辨率

一种微小卫星集群多模态遥感图像目标检测与识别方法

多模态注意力识别方法集群语义特征输出特征

多模态大模型的销售助手产品文档结构识别方法、系统

站点导航

APP 下载