摘要
本发明提供了一种地理空间信息样本生成方法、装置、设备及介质,利用空间关系计算从地图服务数据中提取结构化地理空间三元组,避免了人工标注的高成本与低效问题;对获取的与研究区域对应的地理空间信息文本集进行分析,得到空间关系文本描述形式,将地理空间信息结构化三元组和编码后的空间关系文本描述输入大语言模型基于prompt模板进行扩充,避免了数据增强可能带来的语义偏差,克服了规则模板在处理多样化语料时的局限性,提升了地理空间信息数据生成的多样性。
技术关键词
样本生成方法
地图服务
三元组
大语言模型
生成自然语言
自然语言文本
聚类
关系
DBSCAN模型
地理空间信息数据
编码
异常数据
邻居
BERT模型
分析模块
模板
地理实体