摘要
本申请提供了一种基于多模态大模型的图片金融指令解析方法及相关装置。方法包括:S1,输入包含投资交易指令的原始文档图片,使用光学字符识别模型对原始文档图片进行文本识别,得到文本块列表;S2,针对文本块列表,构建图片交易指令解析提示语句和位置信息向量,并将图片交易指令解析提示语句和位置信息向量输入图片交易指令解析大模型,由图片交易指令解析大模型输出对应的交易指令列表,交易指令列表包含图片中所有的交易指令;S3,针对交易指令列表,与交易业务知识库进行比对和验证,根据业务规则补充附属要素,以及根据文本特征修正因光学字符识别错误导致的文本错误要素;S4,输出经过上述处理步骤后的完整交易指令。
技术关键词
指令解析方法
图片
大语言模型
多模态
列表
光学字符识别
语句
金融
文本识别
模型预训练
坐标
表格
解析系统
格式
模块
企业业务数据
企业知识库
系统为您推荐了相关专利信息
起重吊臂
电子围栏
智能预警系统
动态
资源分配模块