摘要
本发明提出基于大模型的标准化数据处理方法、电子设备、存储介质和计算机程序产品,方法包括:通过大模型编码字段名称字符串输入、字段值样本列表及字段的上下文结构信息,生成标准字段语义向量;计算待标准化字段语义向量与标准化字段语义向量的语义偏移度,生成成功匹配字段对集和归一失败字段集合;获取历史标准版本,生成最优字段和最大得分版本映射集合;根据所述最优字段在最大得分版本中进行语义定位,计算匹配字段;基于所述匹配字段的映射规则表,获得其在当前版本下的标准映射字段信息,并输出。本发明避免了传统规则系统对固定字段依赖、对版本变更不敏感的问题。
技术关键词
标准化数据处理方法
语义向量
字段
计算机程序产品
唯一性
数据源系统
前馈神经网络
编码器结构
电子设备
可读存储介质
存储计算机程序
列表
样本
注意力机制
处理器
序列
字典
系统为您推荐了相关专利信息
显示驱动芯片
图像处理方法
显示屏模组
处理器
静态随机存取存储器
血缘分析方法
解析算法
分片
数据库驱动程序
细粒度模型
上报方法
交通管理平台
多媒体
举报系统
车辆违章信息