摘要
本发明公开了一种用于文本扩展的机器学习模型的优化方法和装置,所述方法包括:将第一文本输入预设的第一机器学习模型中进行扩展,得到第二文本;获取所述第二文本中重复文本的样本集,并将所述样本集与第一预设文本进行比对,得到配对数据集;根据所述配对数据集训练奖励模型,并根据所述奖励模型对所述第一机器学习模型进行优化,得到第二机器学习模型;评估所述第二机器学习模型输出文本的重复问题是否减轻,并在所述第二机器学习模型输出文本的重复问题减轻的情况下,确定所述第二机器学习模型为目标机器学习模型。该方法能够显著提高扩展文本的质量,减少重复内容带来的扩展文本质量低的问题,提升用户的使用体验,并能够提高效率。
技术关键词
机器学习模型
文本
样本
处理器
扩展模块
优化装置
扩展器
程序
数据
可读存储介质
存储器
计算机