垂直领域大语言模型的训练方法、装置和电子设备

AITNT
正文
推荐专利
垂直领域大语言模型的训练方法、装置和电子设备
申请号:CN202410880683
申请日期:2024-07-02
公开号:CN119047566A
公开日期:2024-11-29
类型:发明专利
摘要
本发明提供一种垂直领域大语言模型的训练方法、装置和电子设备,涉及人工智能技术领域。所述垂直领域大语言模型的训练方法,包括:获取目标垂直领域文本数据;从目标垂直领域文本数据中提取频繁出现的相邻字符对,得到目标垂直领域词表;使用目标垂直领域词表,扩充基础大语言模型的原始词表;对扩充原始词表后的基础大语言模型进行继续训练,得到目标垂直领域大语言模型,以利用目标垂直领域大语言模型生成针对目标垂直领域问题的答案。本发明可以充分利用有限的特定垂直领域的标注数据,以根据有限的标注数据训练得到在特定垂直领域表现良好的大语言模型。
技术关键词
大语言模型 字符 文本 数据 基础 非暂态计算机可读存储介质 序列 电子设备 答案 处理器 频率 扩充模块 人工智能技术 计算机程序产品 训练装置 存储器
系统为您推荐了相关专利信息
1
一种面向高新技术企业的动态指标评估与精准决策管理方法
高新技术企业 决策管理方法 指标 粒子群优化算法 数据缺失值
2
基于人工智能检测模型的白蚁危害识别方法及系统
地质雷达 白蚁巢穴 多任务分类 数据 融合特征
3
音频文件存储方法、装置、电子设备、存储介质及程序
音频文件存储方法 分片 文本识别 数据获取模块 关键词
4
基于售电商批发及零售联动的决策方法、装置和设备
资源交易平台 构建决策模型 电力资源数据 电商 后台服务器
5
一种HCBiGRU混合神经网络的融合定位方法
步长估计 地磁 深度学习神经网络 加速度 融合定位方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号