大语言模型的训练方法、装置、计算机设备和存储介质

AITNT
正文
推荐专利
大语言模型的训练方法、装置、计算机设备和存储介质
申请号:CN202411955451
申请日期:2024-12-28
公开号:CN119783853A
公开日期:2025-04-08
类型:发明专利
摘要
本申请涉及一种大语言模型的训练方法、装置、计算机设备和存储介质。所述方法包括:获取原始回答文本数据;去除原始回答文本数据中的第一回答文本数据,得到第二回答文本数据;第一回答文本数据为包括目标语言单元的回答文本;目标语言单元为用于表达拒绝回答语义的语言单元;去除第二回答文本数据中的第三回答文本数据,得到第四回答文本数据;第三回答文本数据为通过预训练的第一大语言模型识别出的含有拒绝回答意图的回答文本;采用包含有第四回答文本数据的训练样本数据对待训练的第二大语言模型训练,得到目标大语言模型。采用本方法能够解决大语言模型在面对用户的提问时输出的回答文本具有局限性的问题。
技术关键词
大语言模型 数据生成模型 文本 训练样本数据 计算机设备 意图 计算机程序产品 处理器 语义 训练装置 可读存储介质 规模 指令 模块 存储器 参数 场景
系统为您推荐了相关专利信息
1
电网调控运行规程文件知识表征建模方法、系统及设备
序列标注模型 建模方法 条件随机场 数据 建模系统
2
一种用于商品更换背景的方法、装置、设备和介质
大语言模型 生成场景 抠图算法 图片 矩阵
3
权限处理方法、装置、计算机设备及存储介质
验证规则 业务系统 策略 执行访问控制 计算机可读指令
4
一种基于选择性状态空间融合的眼科影像分类方法
影像分类方法 医学影像数据 小波多尺度 眼科 特征提取器
5
基于大语言模型与推测算法协同的建表方法及装置
大语言模型 统计特征 样本 表头 标识
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号