摘要
本发明公开了一种面向舆情文本的地址抽取方法,该方法首先获取舆情文本数据,然后将数据输入到经过监督微调和少样本提示优化的预训练大模型中,抽取地址信息,接着对地址信息进行结构化拆解,然后再进行坐标计算获取目标地址坐标,最后将计算出的最终目标地址坐标与真实坐标进行比较,统计偏移误差和平均误差。本发明通过在预训练大模型基础上,通过监督微调和少样本提示,实现对舆情文本中噪声大、口语化和模糊描述的地址信息的准确抽取,能充分利用上下文语义进行自动纠错和补全,显著提升地址抽取的鲁棒性和准确性。并基于基准坐标结合方位距离信息进行坐标修正,计算目标地址的精确坐标,实现对目标地址的精确坐标定位。
技术关键词
舆情文本
坐标
偏移误差
方位角
基准
数据
地图服务
样本
距离信息
交叉口
关键字
鲁棒性
纠错
语义
小区
噪声
阶段
平台
接口
系统为您推荐了相关专利信息
探头标定方法
结构先验
电磁传感器
标定模体
超声图像数据