一种基于自适应选择性掩码的领域预训练的新闻分类方法

AITNT
正文
推荐专利
一种基于自适应选择性掩码的领域预训练的新闻分类方法
申请号:CN202411597329
申请日期:2024-11-11
公开号:CN119166821A
公开日期:2024-12-20
类型:发明专利
摘要
本发明涉及一种基于自适应选择性掩码的领域预训练的新闻分类方法,属于自然语言处理技术领域。本发明包括步骤:在BERT分类模型的通用预训练和微调之间增加一个领域特定预训练阶段,在领域引导预训练过程中提供一种自适应选择掩蔽策略;对BERT分类模型的每一层使用不同的学习率进行微调,具体的是为不同的层设置不同的学习率;检查并删除下游监督学习任务中可能存在的错误标签数据,重新加权并重新训练标签数据。本发明提高了模型的预训练效率和新闻文本分类的准确性。
技术关键词
新闻分类方法 预训练模型 噪声标签 掩码策略 标记 预热策略 无监督 数据 文本 Softmax函数 训练语言模型 前馈神经网络 矩阵 编码器 随机梯度下降 阶段 评分机制 微调方法
系统为您推荐了相关专利信息
1
一种对病理蜡块的处理方法及系统
图像 存储装置 控制机械臂装置 托盘 指令
2
基于RFSOC多通道宽带信号的采集处理方法
多通道 异常状态 信号滤波 芯片 采样率
3
日志服务识别方法、装置、设备及介质
模版 服务识别方法 节点 日志管理 时间段
4
血液透析内瘘穿刺针耗材管理系统及其方法
内瘘穿刺针 耗材管理方法 血液透析患者 耗材管理系统 提示管理人员
5
基于BIM的水利工程安全预警方法、装置、设备及介质
BIM构件 渗流参数 卷积模型 物理特征参数 坐标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号