农业领域大语言模型训练方法、设备及介质

AITNT
正文
推荐专利
农业领域大语言模型训练方法、设备及介质
申请号:CN202411012153
申请日期:2024-07-26
公开号:CN119128070A
公开日期:2024-12-13
类型:发明专利
摘要
本申请提供了一种农业领域大语言模型训练方法、设备及介质,农业领域大语言模型训练方法包括:收集农业领域数据图书信息进行预处理获取第一汉语数据集和第一少数民族语言数据集,将第一汉语数据集和第一少数民族语言数据集合并生成第一混合语言数据集并采用分词库进行处理后采用预设的特殊字符处理方法进行二次处理,并构建分词表,构建WordPiece词片模型对分词表进行处理和划分;采用词嵌入算法将分词表中的每个词转换为词向量;构建基于Transformer架构的采用自注意力机制的编码组件和解码器组件,生成农业领域大语言模型,以及,以词向量作为输入对农业领域大语言模型进行训练得到训练好的农业领域大语言模型。以解决支持汉语和少数民族语言的大语言模型问题。
技术关键词
大语言模型 农业 数据 解码器 多头注意力机制 计算机可执行指令 编码器 图书 网络层结构 前馈神经网络 词典 分词 优化器 参数 文本
系统为您推荐了相关专利信息
1
文本处理方法、系统及存储介质
排序模型 大语言模型 文本处理系统 计算机可读非易失性存储介质 文本处理方法
2
告警处置辅助方法、装置、设备、存储介质及产品
大语言模型 网元 拓扑图 词嵌入向量 关联告警信息
3
图结构数据处理方法、加速器、存储介质和程序产品
矩阵 压缩特征 神经网络加速器 结构数据处理方法 标签
4
一种隧道围岩稳定性自动监测预警方法及系统
微震事件 多源融合 监测预警方法 隧道围岩 解耦算法
5
一种园区网分级多粒度访问控制方法及系统
多粒度访问控制方法 SDN控制器 网络拓扑数据 资源 流表规则
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号