文本生成序列长度预测模型及其训练方法

正文

推荐专利

文本生成序列长度预测模型及其训练方法

申请号：CN202510069697

申请日期：2025-01-16

公开号：CN120106041A

公开日期：2025-06-06

类型：发明专利

摘要

本申请涉及数据处理技术领域，尤其涉及一种文本生成序列长度预测模型及其训练方法，通过在开源大语言模型生成token的过程中，引入了一个目标网络结构，嫁接于开源大语言模型的后方，用于在开源大语言模型生成token的同时，预测完成当前对话还需要继续生成的token数量。其中，目标网络结构可以包括可训练请求网络结构、Transformer网络结构和Linear网络结构，通过结合开源大语言模型和目标网络结构，能够在文本生成的同时进行序列长度的预测。

技术关键词

网络结构大语言模型序列文本开源社区指令精度数据处理技术处理器存储器线性注意力编码电子设备参数

文本生成序列长度预测模型及其训练方法

站点导航

APP 下载