大语言模型性能优化方法、装置、存储介质及电子设备

正文

推荐专利

申请号：CN202510354242

申请日期：2025-03-25

公开号：CN119862913B

公开日期：2025-07-22

类型：发明专利

摘要

本申请提供一种大语言模型性能优化方法、装置、存储介质及电子设备，涉及自然语言处理领域。电子设备通过大语言模型对已生成文本进行处理，得到传输至主解码头的隐藏状态信息；其中，大语言模型还包括与主解码头并行的多个从解码头，多个从解码头之间的预设排列顺序表征解码结果之间的排列顺序；然后，将每个从解码头的序列信息与隐藏状态信息结合，得到每个从解码头的待解码信息；最后，根据从每条待解码信息解码出的候选词集，得到已生成文本后续的最佳预测文本。如此，通过将每个从解码头的序列信息与隐藏状态信息结合后，通过多个从解码头并行对各自的待解码信息进行解码，从而能够在保持推理精度的同时显著提升大语言模型的推理速度。

技术关键词

性能优化方法大语言模型解码信息码头文本掩码矩阵序列电子设备位置映射性能优化装置冗余注意力机制元素解码模块自然语言处理器语义

大语言模型性能优化方法、装置、存储介质及电子设备

站点导航

APP 下载