摘要
本发明公开了一种多标签分类模型构建方法,具体涉及多标签分类模型构建方法技术领域,具体的包括以下步骤:S1、获取原始小样本语句;S2、采用成熟的中文词切分技术;S3、在模型中引入功能性相对位置编码机制;S4、模型预训练;S5、预训练完成;S6、模型训练。本发明所述的一种多标签分类模型构建方法,通过“自研70BMoE大模型+prompt”方式,能快速生成高质量训练数据,有效缩短模型训练周期,从而加速AI产品从研发到推向市场的速度,在实际场景中,比如在开发一款新的智能写作助手产品时,利用该方式可以迅速获取大量与写作相关的训练数据,使模型能够更快地学习到各种写作风格和语法规则,大大缩短产品的研发周期,让产品能够更早地进入市场。
技术关键词
分类模型构建方法
多标签
编码机制
启发式规则
语句
模拟真实环境
定制化数据
文本
样本
智能写作
同义词
模型预训练
掩码策略
格式
语义
汉字
阶段
鲁棒性
噪声
系统为您推荐了相关专利信息
数字档案管理系统
风险
分析模块
定位文本位置
抽象语法树
语句
主题
舆情分析方法
生成会议纪要
会议纪要生成方法