摘要
本公开提供了一种模型训练、文本内容识别方法、装置、设备及介质,涉及数据处理领域,具体涉及深度学习、自然语言处理、人工智能、大模型和生成式模型技术领域。具体实现方案为:获取风险训练样本集合;根据所述风险训练样本集合中各风险训练样本,对风险识别提示模板进行处理,得到各所述风险训练样本对应的风险识别提示模板;根据所述风险训练样本集合中各风险训练样本与对应的风险识别提示模板对目标模型进行微调,得到已训练的大语言模型。本公开实施例可以提高风险内容的识别准确性。
技术关键词
风险
模板
内容识别方法
冗余
大语言模型
样本
模块
上采样
微调单元
计算机程序产品
文本识别
训练装置
处理器通信
识别装置
自然语言
指令
数据