摘要
本申请涉及人工智能技术,提供了基于小型语言模型的多任务执行方法、装置、设备及介质,其根据不同的任务类型从中央处理器的主内存中获取不同的Lora权重,并加载到图形处理器的显存中,进一步分别在小型语言模型的初始权重及Lora权重下执行权重计算,并合并计算结果以生成最终的任务执行结果,能够基于Lora微调及小规模模型实现金融场景下的多任务部署,既保证了任务性能,又降低了部署成本。
技术关键词
多任务执行方法
矩阵
中央处理器
图形处理器
多任务执行装置
内存
可读存储介质
标识
人工智能技术
金融
加载单元
合并单元
计算机设备
场景
小规模
存储器
标记