摘要
本申请提供了一种农业领域大语言模型训练方法、设备及介质,农业领域大语言模型训练方法包括:收集农业领域数据图书信息进行预处理获取第一汉语数据集和第一少数民族语言数据集,将第一汉语数据集和第一少数民族语言数据集合并生成第一混合语言数据集并采用分词库进行处理后采用预设的特殊字符处理方法进行二次处理,并构建分词表,构建WordPiece词片模型对分词表进行处理和划分;采用词嵌入算法将分词表中的每个词转换为词向量;构建基于Transformer架构的采用自注意力机制的编码组件和解码器组件,生成农业领域大语言模型,以及,以词向量作为输入对农业领域大语言模型进行训练得到训练好的农业领域大语言模型。以解决支持汉语和少数民族语言的大语言模型问题。
技术关键词
大语言模型
农业
数据
解码器
多头注意力机制
计算机可执行指令
编码器
图书
网络层结构
前馈神经网络
词典
分词
优化器
参数
文本
系统为您推荐了相关专利信息
排序模型
大语言模型
文本处理系统
计算机可读非易失性存储介质
文本处理方法
大语言模型
网元
拓扑图
词嵌入向量
关联告警信息
矩阵
压缩特征
神经网络加速器
结构数据处理方法
标签
微震事件
多源融合
监测预警方法
隧道围岩
解耦算法
多粒度访问控制方法
SDN控制器
网络拓扑数据
资源
流表规则