摘要
本发明涉及水土保持技术领域,特别是涉及一种利用大语言模型构建水土保持专业数据集的方法,包括如下步骤:S1、收集近十年水土保持方案、规划设计、法律法规及科研成果等文献资料。S2、利用文本解析接口将各类文档转换为统一格式文本数据库。S3、基于提示词簇调用大语言模型生成针对九大应用场景的专业问答对。S4、通过向量匹配技术检测数据重合度,实现数据集的自动化智能更新。通过此方法可以构建专业化的水土保持文本数据库,自动生成针对水土流失预测、措施布设、效益评估等场景的训练数据集,从而为水土保持大语言模型的优化提供高质量数据支撑。
技术关键词
数据集构建方法
大语言模型
水土流失预测
文本
格式
专业
小流域综合治理
水土保持技术
数据分类
视角
实验室研究
论文
场景分类
报告
措施
接口
身份
图片
系统为您推荐了相关专利信息
文本分类模型
数据集构建方法
样本
文本分类方法
自然语言
计量系统
区块链存证
优化调度算法
模型更新
监测传感器
语句
Word2Vec模型
语义
BERT模型
样本