摘要
本申请公开一种大语言模型更新方法、装置以及电子设备,属于人工智能技术领域。该方法包括:对输入到大语言模型中的目标文本进行向量化编码,得到目标文本对应的文本向量;对文本向量进行特征提取,获得文本向量对应的中间向量;根据中间向量与历史文本对应的历史超参数,获得大语言模型在处理目标文本时对应的目标超参数;将大语言模型的超参数更新为目标超参数,使用更新后的大语言模型生成与目标文本对应的输出结果。通过上述方式,可以根据目标文本的需求,针对性的调整大语言模型的超参数,获得合适的输出结果。
技术关键词
大语言模型
超参数
文本
深度神经网络
更新方法
电子设备
编码
可读存储介质
人工智能技术
处理器
程序
指令
语义
模块
存储器
计算机
基础