多模态大模型的销售助手产品文档结构识别方法、系统

AITNT
正文
推荐专利
多模态大模型的销售助手产品文档结构识别方法、系统
申请号:CN202411528841
申请日期:2024-10-30
公开号:CN119763127A
公开日期:2025-04-04
类型:发明专利
摘要
本申请涉及多模态大模型技术领域,尤其涉及多模态大模型的销售助手产品文档结构识别方法、系统。通过获取待识别的销售助手产品文档信息;将获取待识别的销售助手产品文档信息,输入预先设置的多模态模型,输出识别后的销售助手产品文档信息。可以理解的是,本发明提供的技术方案,利用多模态大模型同时利用文本和视觉信息,同时利用文字和视觉信息进行文档结构识别,识别效果优异;另外,可以降低对标注数据量的依赖,同时新场景迁移成本低;可以生成模型端到端方案,同时生成内容块位置、类型、阅读顺序,通过提出生成式损失和区域框回归损失结合的多任务损失,弥补生成式损失的局限性。
技术关键词
视觉特征信息 结构识别方法 视觉特征提取 多模态 对齐模块 特征提取器 文本 识别系统 多任务 表达式 图像 标签 坐标 场景 序列
系统为您推荐了相关专利信息
1
一种基于多模态数据的数字孪生系统及构建方法
数字孪生系统 活动推荐系统 出行技术 交互系统设计 仿真环境
2
一种马铃薯育种用的监测分析系统及方法
马铃薯育种 监测分析系统 多模态数据采集 监测分析方法 多光谱成像装置
3
一种慢性Doc患者分级诊断方法及系统
诊断方法 深度学习模型 患者 协方差矩阵 深度学习优化
4
面向目标航天器监测的小型航天器轨迹多目标优化方法
小型航天器 多模态传感器 二维图像数据 三维点云数据 分辨率
5
一种微小卫星集群多模态遥感图像目标检测与识别方法
多模态注意力 识别方法 集群 语义特征 输出特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号