摘要
本发明实施例涉及一种引入条件约束的大语言模型的处理方法和装置,所述方法包括:为每个条件规则定制对应的第一状态预测模型;并为每个条件规则创建对应的模型训练数据集来训练对应的第一状态预测模型;将任一类基于Transformer架构实现并已完成预训练和微调的大语言模型记为第一大语言模型;选择一个或多个条件规则对应的所有第一状态预测模型组建多规则状态预测模型,并在第一大语言模型的基础上增加多规则状态预测模型和约束解码控制模块构成第二大语言模型;基于第二大语言模型根据用户输入文本进行对应的约束文本生成处理并输出对应的约束生成文本向用户反馈。本发明可以提高模型的规则适配灵活度,降低计算量、提高时效性。
技术关键词
大语言模型
文本
自动机
序列
解码模块
解码控制
编码向量
编码模块
优化器
索引
数据
表达式
输入端
标签
条目
拼接模块
分词
语义规则
编码特征