农业领域大语言模型训练方法、设备及介质

正文

推荐专利

农业领域大语言模型训练方法、设备及介质

申请号：CN202411012153

申请日期：2024-07-26

公开号：CN119128070A

公开日期：2024-12-13

类型：发明专利

摘要

本申请提供了一种农业领域大语言模型训练方法、设备及介质，农业领域大语言模型训练方法包括：收集农业领域数据图书信息进行预处理获取第一汉语数据集和第一少数民族语言数据集，将第一汉语数据集和第一少数民族语言数据集合并生成第一混合语言数据集并采用分词库进行处理后采用预设的特殊字符处理方法进行二次处理，并构建分词表，构建WordPiece词片模型对分词表进行处理和划分；采用词嵌入算法将分词表中的每个词转换为词向量；构建基于Transformer架构的采用自注意力机制的编码组件和解码器组件，生成农业领域大语言模型，以及，以词向量作为输入对农业领域大语言模型进行训练得到训练好的农业领域大语言模型。以解决支持汉语和少数民族语言的大语言模型问题。

技术关键词

大语言模型农业数据解码器多头注意力机制计算机可执行指令编码器图书网络层结构前馈神经网络词典分词优化器参数文本

系统为您推荐了相关专利信息

文本处理方法、系统及存储介质

排序模型大语言模型文本处理系统计算机可读非易失性存储介质文本处理方法

告警处置辅助方法、装置、设备、存储介质及产品

大语言模型网元拓扑图词嵌入向量关联告警信息

图结构数据处理方法、加速器、存储介质和程序产品

矩阵压缩特征神经网络加速器结构数据处理方法标签

一种隧道围岩稳定性自动监测预警方法及系统

微震事件多源融合监测预警方法隧道围岩解耦算法

一种园区网分级多粒度访问控制方法及系统

多粒度访问控制方法 SDN控制器网络拓扑数据资源流表规则

农业领域大语言模型训练方法、设备及介质

站点导航

APP 下载