摘要
本申请提供一种港口文本数据处理方法、装置、设备及介质。在该方法中,通过根据港口数据项对应的替换字符串对第一大语言模型和第二大语言模型进行分词器和嵌入值修改处理,得到第三大语言模型和第四大语言模型。进而根据第三大语言模型和港口号码替换表,对原始港口训练数据进行数据项替换处理,得到目标港口训练数据后,对第四大语言模型进行训练,得到目标大语言模型。最后根据目标大语言模型和文本嵌入模型,对初始港口文本数据进行处理,得到目标向量。本方案通过使用训练得到的用于替换港口数据项的目标大语言模型,以及文本嵌入模型,对初始港口文本数据进行处理,得到目标向量,有效提高了目标向量与港口数据项的匹配性。
技术关键词
大语言模型
文本数据处理方法
数据项
标记
基准
文本数据处理装置
号码
模型训练模块
处理器
补偿值
通信接口
可读存储介质
存储器
电子设备
指令
关系
系统为您推荐了相关专利信息
干扰识别方法
摘要
声纹识别技术
干扰识别装置
特征矢量序列
图形用户界面
资源
信息标记方法
游戏场景
地图上显示