大语言模型的训练方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
大语言模型的训练方法、装置、电子设备及存储介质
申请号:CN202510786174
申请日期:2025-06-11
公开号:CN120670850A
公开日期:2025-09-19
类型:发明专利
摘要
本申请实施例提供了一种大语言模型的训练方法、装置、电子设备及存储介质,可涉及人工智能领域,该方法包括:获取提示词和多个样本问题,针对每个样本问题,将该样本问题和提示词输入到大语言模型中,通过执行多次答复生成操作得到该样本问题的多个答复,基于该样本问题的多个答复的语义相似性,聚类得到多个答复簇,根据每一答复簇中答复的数量,确定该答复簇中各答复对应的奖励,根据该样本问题的各答复对应的奖励,确定该样本问题对应的第一奖励,根据各样本问题对应的第一奖励,对大语言模型的模型参数进行调整,通过迭代训练得到训练后的大语言模型。该方法在无监督环境下实现了模型推理能力的有效提升,显著增强了模型的灵活性和实用性。
技术关键词
样本 大语言模型 分词 计算机程序产品 参数 电子设备 信息熵 基准 聚类 处理器 语义 训练装置 关系 可读存储介质 存储器 模块
系统为您推荐了相关专利信息
1
基于塑性层调控的微动疲劳性能优化方法
性能优化方法 微动疲劳寿命 激光 接触区 关系
2
建筑物的移动闭合装置控制方法、系统、设备和存储介质
闭合装置控制 传感器阵列 建筑物 去噪算法 信号
3
一种WiFi射频自动化检测系统
自动化检测系统 机械臂单元 自动化控制模块 信号采集模块 干扰信号发生器
4
基于高光谱图像的稻种活力检测方法及系统
活力检测方法 量子态 箱子 局部特征提取 特征值
5
基于三维模型焊接参数子程序自动调用方法
焊接机器人 焊接工艺参数 自动调用方法 三维模型 自动调用系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号