摘要
本发明公开了一种运单识别方法和计算机可读存储介质,所述方法包括:获取目标运单图片;确定所述目标运单图片对应的提示词的选定方式;当所述选定方式为自定义方式时,在所述目标运单图片中标注出多个字段名;基于标注出的字段名确定所述目标运单图片中待识别的关键字段名;基于所述关键字段名构建所述目标运单图片对应的提示词;将所述目标运单图片以及所述目标运单图片对应的提示词共同输入至预设的多模态大模型中,以使所述多模态大模型在所述目标运单图片中识别出与所述关键字段名对应的字段。
技术关键词
图片
多模态
OCR识别模型
矫正
识别方法
按键
可读存储介质
模版
模板
字符
标记
指令
计算机
字段
尺寸
处理器
系统为您推荐了相关专利信息
停留点识别方法
泰森多边形
手机信令数据
基站
网络
识别方法
注意力
生成图像文件
计算机执行指令
网络检测模型
状态空间模型
视觉
更新方法
在线学习机制
嵌入位置信息