用于医疗大模型的医学元数据处理和去标识化方法、系统

正文

推荐专利

申请号：CN202411813340

申请日期：2024-12-11

公开号：CN119293643B

公开日期：2025-03-25

类型：发明专利

摘要

本发明提供一种用于医疗大模型的医学元数据处理和去标识化方法、系统，所述的方法包括：基于初始数据蒸馏模型对医学元数据进行压缩，生成压缩后的数据；利用压缩后的数据对数据蒸馏模型进行训练，生成优化后的模型参数；利用优化后的模型参数对压缩后的数据继续压缩；所述压缩步骤和训练步骤交替迭代，直至模型参数收敛。本发明能够实现在信息几乎不丢失的情况下以最小的数据量支持特定任务的模型高效训练，使得在浓缩后的数据集上训练出的模型与在原数据集上训练而成的模型表现相似。通过结合差分模型，还能够实现去隐私信息化，通过上述方法压缩重构后的数据具有泛用性，能支持不同架构的人工智能模型训练。

技术关键词

医学蒸馏特征数据提取标识化系统文本参数人工智能模型训练模块计算机设备算法模型存储器处理器重构噪声

系统为您推荐了相关专利信息

一种基于多智能体协作的智能写作方法

智能写作方法多智能体协作生成文章大纲大语言模型文本

轻量化自然语言处理大模型训练方法

模型训练方法数据上下文特征融合特征语义

基于大语言模型的金融融资规划方案提供系统

金融大语言模型规划矩阵文本

一种学生潜能与偏向识别方法、装置及可读存储介质

学生识别方法动态变化特征教学方法报告

一种基于大模型的试卷阅卷方法及装置

试卷阅卷方法模板匹配技术考试录像视频答题编码器

用于医疗大模型的医学元数据处理和去标识化方法、系统

站点导航

APP 下载