摘要
在本申请提供的基于大语言模型的海运运价文本识别方法中,获取海运运价文本,采用大语言模型从海运运价文本中提取初始关键信息和备注信息;对初始关键信息进行修正后,通过大语言模型利用港口五字码表,将已修正关键信息中非标准的港口名称转换为标准的港口名称,得到已转换关键信息;按照获取的航线对应表,调整已转换关键信息中每个航名航次对应的港口,得到有效关键信息,采用备注信息对有效关键信息进行补充,得到目标关键信息;根据目标关键信息,采用大语言模型生成多个实体对应关系,采用大语言模型对各个实体关系中同名港口的箱型价格进行验证后,按照各个实体关系生成海运运价表格。此方法提高了非结构海运运价文本的运价信息提取效率。
技术关键词
大语言模型
文本识别方法
计算机可读指令
实体
码表
表格
关系
文本识别装置
处理器
笛卡尔
计算机设备
物流
模块
存储器
数据
系统为您推荐了相关专利信息
检测半导体晶圆
缺陷检测方法
样本
训练数据量
图片
识别训练方法
大语言模型
蒸馏
训练样本集
输出特征
文本
文章
评估模型构建方法
术语
网络信息采集系统