摘要
本发明提供一种垂直领域大语言模型的训练方法、装置和电子设备,涉及人工智能技术领域。所述垂直领域大语言模型的训练方法,包括:获取目标垂直领域文本数据;从目标垂直领域文本数据中提取频繁出现的相邻字符对,得到目标垂直领域词表;使用目标垂直领域词表,扩充基础大语言模型的原始词表;对扩充原始词表后的基础大语言模型进行继续训练,得到目标垂直领域大语言模型,以利用目标垂直领域大语言模型生成针对目标垂直领域问题的答案。本发明可以充分利用有限的特定垂直领域的标注数据,以根据有限的标注数据训练得到在特定垂直领域表现良好的大语言模型。
技术关键词
大语言模型
字符
文本
数据
基础
非暂态计算机可读存储介质
序列
电子设备
答案
处理器
频率
扩充模块
人工智能技术
计算机程序产品
训练装置
存储器
系统为您推荐了相关专利信息
高新技术企业
决策管理方法
指标
粒子群优化算法
数据缺失值
音频文件存储方法
分片
文本识别
数据获取模块
关键词
资源交易平台
构建决策模型
电力资源数据
电商
后台服务器
步长估计
地磁
深度学习神经网络
加速度
融合定位方法