摘要
本申请公开了一种基于相似度聚类和相似度检索的数据样本处理方法及装置,涉及人工智能领域。其中,该方法包括:对N个数据样本进行相似度聚类,得到X个簇群;从X个簇群中检索出与待解析报文相关的至少一个目标数据样本;依据目标数据样本调整待解析报文对应的初始提示词,得到目标提示词;通过目标提示词和大语言模型对待解析报文进行解析。本申请解决了现有技术中依赖于规则匹配或简单的模式识别来实现对航行通告报文的解析,由于无法有效处理通告中隐含的复杂语义,导致的解析准确度较低的技术问题。
技术关键词
解析报文
样本
数据
字段
可读存储介质
代表
处理单元
计算机
语义
文本
解析单元
模式识别
处理器
数值
存储器
模板
电子设备
明文
程序
系统为您推荐了相关专利信息
三维场景重建方法
图像处理模型
单目深度估计
三维场景数据
图像处理算法
序列化方法
数据采集程序
仿真程序
主题
智能驾驶技术
DC系统
参数优化方法
学习算法
训练样本数据
序列
需求预测方法
机器学习模型
描述符
固相萃取柱
富集