大语言模型的预训练方法、交互方法、系统及存储介质

AITNT
正文
推荐专利
大语言模型的预训练方法、交互方法、系统及存储介质
申请号:CN202510805244
申请日期:2025-06-16
公开号:CN120706555A
公开日期:2025-09-26
类型:发明专利
摘要
本说明书提供一种预训练方法、交互方法、系统及存储介质,包括:获得预训练数据集,其中,预训练数据集用于学习推理能力和通用能力,推理能力包括代码能力、数学能力,预训练数据集中包括第一数据集和第二数据集,第一数据集侧重于学习代码能力,第二数据集侧重于学习数学能力,根据预训练数据集对基础大语言模型进行多阶段预训练,得到目标大语言模型,其中,微调后的目标大语言模型用于确定与输入问题对应的输出回答。实现了目标大语言模型在推理能力和通用能力的同步提升。
技术关键词
大语言模型 计算机可读非暂时性存储介质 多阶段 数据 交互方法 数学 基础 预训练方法 处理器 训练系统 交互系统 通讯
系统为您推荐了相关专利信息
1
一种AR设备的智能控制方法以及系统
瞳孔大小变化 AR设备 图像亮度值 生物特征数据 反射点
2
一种基于信息重要性分级的无人机数据传输系统
信号强度监测 子模块 状态实时监测 模式切换单元 状态监测单元
3
基于多模态深度学习的无人艇参数识别方法及装置
无人艇 多模态深度学习 参数识别方法 参数识别装置 融合多源数据
4
一种抗逆光人脸识别系统及方法
滤波 人脸识别模型 分量特征 小波变换处理 人脸识别模块
5
基于多模型协同的轻量级物联网恶意流量感知方法及系统
随机森林模型 多模型协同 样本 决策树训练 分类器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号