摘要
本发明公开一种基于大语言模型和检索增强生成的地质文本翻译方法,实现了识别地质文本命名实体作为关键词,检索查询专业词典数据库进行增强翻译。在微调大语言模型进行实体识别时,提出了一种句法感知的实体剪枝(Syntax‑Aware Entity Pruning,SAEP)方法进行数据增强引入可控噪声,提高了大语言模型的命名实体识别效果。在构建和检索向量数据库时,基于数据层面给数据信息加上地质分类标签,设置数据相似度查询阈值,提高检索信息的准确性,有效降低通用大语言模型因训练数据缺乏专业领域知识而产生的幻觉问题。
技术关键词
文本翻译方法
大语言模型
词典数据库
中英文对照
命名实体识别模型
关键词
BERT模型
标签
检索策略
岩石结构
分词
专业
节点
术语
指令
系统为您推荐了相关专利信息
深度强化学习
大语言模型
词语
文章
可执行程序代码
烟草农业
知识图谱构建方法
大语言模型
协同方法
知识图谱构建系统