摘要
本发明提供一种多维度大语言模型能力框架搭建的方法及装置,涉及大语言模型技术领域。该方法包括:基于CHC理论模型的认知能力,定义大语言模型的认知维度能力;基于FLASK领域分类体系定义大语言模型的领域维度能力;定义大语言模型的任务维度能力;根据大语言模型的认知维度能力、领域维度能力以及任务维度能力,构建多维度大语言模型能力框架;获取能力标注训练集,采用GPT‑4o模型对训练集进行标注,获得标注后的数据集;根据标注后的数据集,对能力框架进行训练,获得训练好的多维度能力标注模型;获取待筛选的大语言模型的微调数据;将微调数据输入训练好的多维度能力标注模型中,获得高质量微调数据。采用本发明可获得高质量微调数据。
技术关键词
大语言模型
计算机可读取存储介质
数据筛选方法
计算机可读指令
问答场景
训练集
数据筛选装置
定义
框架
标签
模式识别
自然语言
处理器
医药
模块
存储器
理论
系统为您推荐了相关专利信息
大语言模型
中医药
问答系统
服务器模块
数据存储模块
大语言模型
生成方法
词嵌入向量
多头注意力机制
掩码策略
模型训练方法
强化学习算法
三元组
语义向量
大语言模型