一种对大语言模型的文本嵌入模块进行训练的方法和装置

AITNT
正文
推荐专利
一种对大语言模型的文本嵌入模块进行训练的方法和装置
申请号:CN202410961481
申请日期:2024-07-18
公开号:CN118504714B
公开日期:2024-09-24
类型:发明专利
摘要
本发明实施例涉及一种对大语言模型的文本嵌入模块进行训练的方法和装置,所述方法包括:将需要进行训练的文本嵌入模块所在的大语言模型记为对应的第一模型;并指定另一个大语言模型作为对应的第二模型;并将预设的数据生成任务配置作为对应的第一配置;根据第一配置和第二模型进行训练数据集构建得到对应的第一数据集;基于第一数据集对第一模型的文本嵌入模块进行训练。通过本发明可以对文本嵌入模块进行单独训练、提高模块训练效率、降低模块训练成本。
技术关键词
文本 验证平台 样本 数据 模块 大语言模型 指令 计数器 编码向量 模板 生成规则 收发器 计算机 可读存储介质 关系 基准 处理器 变量 存储器 度函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号