摘要
本发明提出了一种智能水利系统语料增强处理方法,包括:文档收集与预处理、文档切块、向量化处理、相似度计算、文档块组合、知识提取与语料集生成等步骤,解决了现有技术中传统的语料处理方法难以满足对水利语料进行精准分析和知识提取的需求的问题。
技术关键词
智能水利
知识提取模板
非临时性存储介质
语义扩展技术
切块
预训练语言模型
专业数据库
词向量模型
水利系统
文本
大语言模型
清洗工具
注意力机制
格式
分词
监测站
同义词
系统为您推荐了相关专利信息
预训练模型
水尺检测方法
水尺图像
图像采集单元
偏差
锅炉控制参数
深度神经网络
锅炉系统
等离子体设备
时序
染色体
结构异常检测方法
编码
单体
显微摄影技术
分类模型训练方法
音频分类方法
频谱特征
切块
注意力机制