垂直领域大语言模型的训练方法、装置和电子设备

正文

推荐专利

申请号：CN202410880683

申请日期：2024-07-02

公开号：CN119047566A

公开日期：2024-11-29

类型：发明专利

摘要

本发明提供一种垂直领域大语言模型的训练方法、装置和电子设备，涉及人工智能技术领域。所述垂直领域大语言模型的训练方法，包括：获取目标垂直领域文本数据；从目标垂直领域文本数据中提取频繁出现的相邻字符对，得到目标垂直领域词表；使用目标垂直领域词表，扩充基础大语言模型的原始词表；对扩充原始词表后的基础大语言模型进行继续训练，得到目标垂直领域大语言模型，以利用目标垂直领域大语言模型生成针对目标垂直领域问题的答案。本发明可以充分利用有限的特定垂直领域的标注数据，以根据有限的标注数据训练得到在特定垂直领域表现良好的大语言模型。

技术关键词

大语言模型字符文本数据基础非暂态计算机可读存储介质序列电子设备答案处理器频率扩充模块人工智能技术计算机程序产品训练装置存储器

系统为您推荐了相关专利信息

一种面向高新技术企业的动态指标评估与精准决策管理方法

高新技术企业决策管理方法指标粒子群优化算法数据缺失值

基于人工智能检测模型的白蚁危害识别方法及系统

地质雷达白蚁巢穴多任务分类数据融合特征

音频文件存储方法、装置、电子设备、存储介质及程序

音频文件存储方法分片文本识别数据获取模块关键词

基于售电商批发及零售联动的决策方法、装置和设备

资源交易平台构建决策模型电力资源数据电商后台服务器

一种HCBiGRU混合神经网络的融合定位方法

步长估计地磁深度学习神经网络加速度融合定位方法

垂直领域大语言模型的训练方法、装置和电子设备

站点导航

APP 下载