摘要
本发明涉及大模型技术领域,公开了一种大语言模型文本输出动态字数控制方法及系统,通过收集资料,基于大模型自动生成高质量的问答对数据和问题数据;利用问答对数据集对大模型进行微调,获得专业模型;利用问题数据集训练奖励模型,对大模型生成的内容根据字数进行评分;利用问答对数据集和奖励模型,基于强化学习算法构建和优化字数控制模型的参数;用户输入问题和字数要求时,将字数要求分配至每个章节,以章节为单位迭代地调用字数控制模型生成每个章节,最终拼接生成整个文章。本发明能够精确控制大模型的输出字数,具有生成准确、可控等优势,从而满足特定应用场景需求,避免因字数过多或过少而导致的发布问题或格式错误,增强用户体验。
技术关键词
问答对数据
文本
强化学习算法
大语言模型
专业
动态
数据分布
参数
策略
资料
适配器
网络结构
表达式
传播算法
模块
控制系统
答案
文章
关系