一种引入条件约束的大语言模型的处理方法和装置

正文

推荐专利

申请号：CN202411493187

申请日期：2024-10-24

公开号：CN119476208B

公开日期：2025-10-24

类型：发明专利

摘要

本发明实施例涉及一种引入条件约束的大语言模型的处理方法和装置，所述方法包括：为每个条件规则定制对应的第一状态预测模型；并为每个条件规则创建对应的模型训练数据集来训练对应的第一状态预测模型；将任一类基于Transformer架构实现并已完成预训练和微调的大语言模型记为第一大语言模型；选择一个或多个条件规则对应的所有第一状态预测模型组建多规则状态预测模型，并在第一大语言模型的基础上增加多规则状态预测模型和约束解码控制模块构成第二大语言模型；基于第二大语言模型根据用户输入文本进行对应的约束文本生成处理并输出对应的约束生成文本向用户反馈。本发明可以提高模型的规则适配灵活度，降低计算量、提高时效性。

技术关键词

大语言模型文本自动机序列解码模块解码控制编码向量编码模块优化器索引数据表达式输入端标签条目拼接模块分词语义规则编码特征

一种引入条件约束的大语言模型的处理方法和装置

站点导航

APP 下载