一种基于大语言模型的低标注海外多国地址的解析方法

正文

推荐专利

申请号：CN202510945101

申请日期：2025-07-09

公开号：CN121031569A

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种基于大语言模型的低标注海外多国地址的解析方法，该方法具体包括如下步骤：S1，获取标注数据，从目标国地址数据库中获取地址数据，进行标注获得结构化数据；S2，将S1中获取的结构化数据进行拆分为训练集和测试集，通过训练集数据获取字段质量检测模型，根据获取的F1值筛选出质量差的字段；S3，获取高质量训练测试数据；S4，将S3中的高质量训练测试数据进行拆分，分为训练集和测试集，通过训练集数据并基于大语言模型训练获取打标助手模型；S5，W2NER小模型训练并上线。本发明通过少量的标注数据训练，结合字段质量检测算法和优化后的数据进行二次训练，实现了小型化且高效的海外地址解析模型。

技术关键词

大语言模型解析方法训练集数据分布式训练字段数值框架列表格式算法元素速度

系统为您推荐了相关专利信息

新闻内容的生成方法、装置、设备、介质及产品

计划实体图谱模版计算机程序指令

渗透测试中的信息收集方法、装置、计算机设备及介质

信息收集方法任务调度策略场景大语言模型深度优先策略

电池材料合成路径生成方法

电池强化学习方法路径生成方法图谱置信度阈值

一种基于大语言模型的代码漏洞检测方法、装置、终端设备及存储介质

代码漏洞检测方法大语言模型抽象语法树漏洞检测装置文本

一种基于图数据库的地理实体应用平台的构建方法

地理实体图元关系测绘地理信息技术对象

一种基于大语言模型的低标注海外多国地址的解析方法

站点导航

APP 下载