摘要
本公开提供一种大语言模型的推理方法、装置、电子设备与可读存储介质,涉及自然语言处理、大语言模型、语音识别、云服务等人工智能技术领域。大语言模型的推理方法包括:获取对用户输入的语音数据进行流式语音识别所得到的多个文本片段;将所述多个文本片段输入到大语言模型,由所述大语言模型对每个文本片段进行预填充处理,得到每个文本片段的预填充结果;响应于确定所述用户停止语音数据的输入,根据全部文本片段的预填充结果,得到目标填充结果;将所述目标预填充结果输入到所述大语言模型,由所述大语言模型对所述目标预填充结果进行前向传播处理与生成输出处理,得到预测文本,将所述预测文本作为所述大语言模型的推理结果。
技术关键词
大语言模型
文本
语音
推理方法
数据
处理单元
电子设备
推理装置
终端设备
人工智能技术
计算机程序产品
处理器通信
自然语言
指令
可读存储介质
存储器
信号