摘要
本申请公开了一种大语言模型的训练方法、交互方法、装置、设备及介质,所述训练方法包括获取加密训练语料集,基于每个所述加密训练语料文档中的实体和/或段落生成合成语料集,将所述合成语料集和所述加密训练语料集进行组合,得到训练语料集;通过所述训练语料集对第一大语言模型进行训练,获得加密训练后的大语言模型。本申请通过加密技术来确定训练语料集,并使用训练语料集对大语言模型进行训练,在确保隐私信息的安全性的基础上保证了训练语料的完整性,提升了大语言模型的训练效果以及预测准确性。
技术关键词
训练语料集
大语言模型
实体
交互方法
计算机可读程序
分词
加密数据
训练装置
密钥
可读存储介质
处理器
加密技术
令牌
语义
终端设备
文本
存储器
模块
系统为您推荐了相关专利信息
学科知识库构建
文本段落
大语言模型
教师
语义向量
镗铣床
三维实体模型
动力学分析方法
计算机可读程序
应力
对象
交易服务平台
客户
业务终端
业务数据处理方法