摘要
本发明公开了一种基于电商大语言模型的多语言多任务处理方法,S1:获取多语言购物查询数据集;S2:构建多语言指令数据集;S3:基于多语言购物查询数据集和多语言指令数据集构建初始微调任务数据集;S4:建立数据选择器,通过数据选择器从初始微调任务数据集中筛选得到最终的微调任务数据集;S5:基于最终的微调任务数据集并利用微调方法对通用领域大语言模型进行微调训练,以得到电商大语言模型;S6:基于电商大语言模型实现交易时的多语言多任务处理。本发明建立多任务训练统一框架进行微调训练,使电商大语言模型可以处理多语言、多任务,提高了模型的可扩展性和准确性,在不牺牲推理效率的情况下显著地增强了跨语言的泛化推理能力。
技术关键词
大语言模型
多任务处理方法
数据选择器
多语言
电商
微调方法
指令
代表
样本
种子
聚类算法
列表
平台
关系
矩阵
框架
参数
系统为您推荐了相关专利信息
知识图谱生成方法
大语言模型
动态更新
实体
运维
电商大数据
人工智能模型
关键词
特征数据库
模板
交互模型
答案
计算机程序产品
交互方法
大语言模型
大语言模型
语言模型训练方法
策略
标签
电子设备