一种基于大语言模型的低标注海外多国地址的解析方法

AITNT
正文
推荐专利
一种基于大语言模型的低标注海外多国地址的解析方法
申请号:CN202510945101
申请日期:2025-07-09
公开号:CN121031569A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于大语言模型的低标注海外多国地址的解析方法,该方法具体包括如下步骤:S1,获取标注数据,从目标国地址数据库中获取地址数据,进行标注获得结构化数据;S2,将S1中获取的结构化数据进行拆分为训练集和测试集,通过训练集数据获取字段质量检测模型,根据获取的F1值筛选出质量差的字段;S3,获取高质量训练测试数据;S4,将S3中的高质量训练测试数据进行拆分,分为训练集和测试集,通过训练集数据并基于大语言模型训练获取打标助手模型;S5,W2NER小模型训练并上线。本发明通过少量的标注数据训练,结合字段质量检测算法和优化后的数据进行二次训练,实现了小型化且高效的海外地址解析模型。
技术关键词
大语言模型 解析方法 训练集数据 分布式训练 字段 数值 框架 列表 格式 算法 元素 速度
系统为您推荐了相关专利信息
1
新闻内容的生成方法、装置、设备、介质及产品
计划 实体 图谱 模版 计算机程序指令
2
渗透测试中的信息收集方法、装置、计算机设备及介质
信息收集方法 任务调度策略 场景 大语言模型 深度优先策略
3
电池材料合成路径生成方法
电池 强化学习方法 路径生成方法 图谱 置信度阈值
4
一种基于大语言模型的代码漏洞检测方法、装置、终端设备及存储介质
代码漏洞检测方法 大语言模型 抽象语法树 漏洞检测装置 文本
5
一种基于图数据库的地理实体应用平台的构建方法
地理实体 图元 关系 测绘地理信息技术 对象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号