一种基于持续学习的林业预训练语言模型构建方法

AITNT
正文
推荐专利
一种基于持续学习的林业预训练语言模型构建方法
申请号:CN202411026587
申请日期:2024-07-29
公开号:CN118886517B
公开日期:2025-08-05
类型:发明专利
摘要
一种基于持续学习的林业预训练语言模型构建方法,属于人工智能及计算机程序技术领域。林业语料库的构建:采用网络爬虫、数据库查询和信息提取方法从中国林业信息网、林业类北大核心期刊渠道收集与林业相关的术语、法律法规、文献三个主题的文本数据,并对其进行去除特殊符号、重复值以及分词等数据清洗和预处理后,得到三个用于预训练的林业语料库,并使用这三个不同主题的林业语料库,基于持续学习方法对通用领域的预训练语言模型BERT进行持续预训练,增强通用领域预训练语言模型在林业领域内的知识,最终形成能够持续学习的林业预训练语言模型ForestryBERT。
技术关键词
预训练语言模型 林业 主题 持续学习方法 信息提取方法 文本 数据 计算机程序技术 答案 术语 预训练方法 样本 标签 爬虫 注意力机制 期刊 分词 渠道 阶段
系统为您推荐了相关专利信息
1
一种面向语言模型智能客服助理系统的高效持续学习方法
持续学习方法 智能客服系统 适配器 在线学习算法 节点
2
一种金融数据智能录入与验证方法
原始文档图像 验证方法 语义向量 字段 语义结构
3
多图像融合的诊断报告生成方法、模型训练方法及设备
疾病诊断信息 诊断报告生成方法 生成模型训练方法 图像 双向长短期记忆网络
4
基于多模态大模型的新闻图像定制化描述生成方法及装置
多模态 生成方法 自定义规则 三元组 图像
5
一种融合Ochiai指数和网络表示学习的数据主题推荐方法
主题推荐方法 个性化主题 网络 指数 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号