一种基于损失阈值和动态权重的自适应医学文本分类方法

正文

推荐专利

申请号：CN202511063903

申请日期：2025-07-31

公开号：CN120561308B

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种基于损失阈值和动态权重的自适应医学文本分类方法，对预先获取的医疗文本进行预处理，然后使用分词器进行文本分词，生成对应的字符序列并进行语义特征编码；基于样本损失分布确定易或难样本阈值，并在后续每轮训练中依据该阈值对样本进行易或难标记与动态权重更新；将医疗文本的语义嵌入与首次被判定为易样本的轮次及最终权重信息融合，以融合特征在特征空间中进行三类数据分层划分，自适应动态再训练预训练语言模型，使模型先在简单难度数据集上进行训练，并根据验证集性能增益动态引入中等及困难难度样本，直至模型在完整的数据集上性能收敛。本发明能提升医学文本分类任务的收敛速度、分类精度和鲁棒性。

技术关键词

文本分类方法预训练语言模型样本预训练模型动态语义特征数据医学字符融合特征序列标记分词鲁棒性分层训练集编码指标

系统为您推荐了相关专利信息

基于多模态数据融合生成医疗建议的方法和系统

动态知识图谱多模态数据融合神经网络推理子模块实体链接技术

一种机器人控制方法及系统

控制机器人动作机器人控制方法手势电子皮肤神经网络模型

一种供电数据自适应传输优化方法、系统、设备及介质

传输优化方法数据传输策略计算机可执行指令动态构建数据融合模型

适用于BNCT治疗的肿瘤动态分割方法与模型训练方法

动态分割方法肿瘤数据模型训练方法分布特征

移动机器人控制多线程调度方法、装置、设备和存储介质

多线程调度方法移动机器人控制运输设备动态地终点

一种基于损失阈值和动态权重的自适应医学文本分类方法

站点导航

APP 下载