摘要
本发明公开了一种基于领域知识增强的产业链大模型构建方法及系统。首先,基于通用预训练大模型,利用产业链文本数据进行领域持续预训练,形成产业链大模型基座;其次,通过生成文档解读、企业人才画像、产业链图认知三类任务的指令‑响应问答对,结合通用问答数据集对产业链大模型基座进行多任务微调和领域偏好优化,使模型具备产业链问题专精能力;最后,针对企业人才画像任务,引入外部知识库的关键词检索结果作为上下文,构建检索增强数据集进行二次微调,最终获得兼具产业链知识深度与外部信息整合能力的垂直领域大模型。该方法通过持续预训练、指令微调、偏好优化和检索增强等技术手段,实现了从通用大模型到产业链专用模型的精准转化。
技术关键词
模型构建方法
人才画像
问答对数据
关键词
文本
基座
计算机电子设备
企业分支机构
生成指令
模型构建系统
样本
模型预训练
主题
专用模型
二分类器
生成文档
存储计算机程序
系统为您推荐了相关专利信息
手写批注信息
符号特征
图纸
文本
卷积循环神经网络
文本
融合语义
生成特征
交叉注意力机制
图像解码器
语音识别功能
显示设备
语音指令识别方法
语义理解模型
声音采集器
电子设备
人工智能内容
人工智能模型
交互方法
链路