模型训练、文本内容识别方法、装置、设备及介质

正文

推荐专利

申请号：CN202411571520

申请日期：2024-11-05

公开号：CN119577215A

公开日期：2025-03-07

类型：发明专利

摘要

本公开提供了一种模型训练、文本内容识别方法、装置、设备及介质，涉及数据处理领域，具体涉及深度学习、自然语言处理、人工智能、大模型和生成式模型技术领域。具体实现方案为：获取风险训练样本集合；根据所述风险训练样本集合中各风险训练样本，对风险识别提示模板进行处理，得到各所述风险训练样本对应的风险识别提示模板；根据所述风险训练样本集合中各风险训练样本与对应的风险识别提示模板对目标模型进行微调，得到已训练的大语言模型。本公开实施例可以提高风险内容的识别准确性。

技术关键词

风险模板内容识别方法冗余大语言模型样本模块上采样微调单元计算机程序产品文本识别训练装置处理器通信识别装置自然语言指令数据

模型训练、文本内容识别方法、装置、设备及介质

站点导航

APP 下载