用于医疗大模型的医学元数据处理和去标识化方法、系统

AITNT
正文
推荐专利
用于医疗大模型的医学元数据处理和去标识化方法、系统
申请号:CN202411813340
申请日期:2024-12-11
公开号:CN119293643B
公开日期:2025-03-25
类型:发明专利
摘要
本发明提供一种用于医疗大模型的医学元数据处理和去标识化方法、系统,所述的方法包括:基于初始数据蒸馏模型对医学元数据进行压缩,生成压缩后的数据;利用压缩后的数据对数据蒸馏模型进行训练,生成优化后的模型参数;利用优化后的模型参数对压缩后的数据继续压缩;所述压缩步骤和训练步骤交替迭代,直至模型参数收敛。本发明能够实现在信息几乎不丢失的情况下以最小的数据量支持特定任务的模型高效训练,使得在浓缩后的数据集上训练出的模型与在原数据集上训练而成的模型表现相似。通过结合差分模型,还能够实现去隐私信息化,通过上述方法压缩重构后的数据具有泛用性,能支持不同架构的人工智能模型训练。
技术关键词
医学 蒸馏 特征数据提取 标识化系统 文本 参数 人工智能模型训练 模块 计算机设备 算法模型 存储器 处理器 重构 噪声
系统为您推荐了相关专利信息
1
一种基于多智能体协作的智能写作方法
智能写作方法 多智能体协作 生成文章大纲 大语言模型 文本
2
轻量化自然语言处理大模型训练方法
模型训练方法 数据 上下文特征 融合特征 语义
3
基于大语言模型的金融融资规划方案提供系统
金融 大语言模型 规划 矩阵 文本
4
一种学生潜能与偏向识别方法、装置及可读存储介质
学生 识别方法 动态变化特征 教学方法 报告
5
一种基于大模型的试卷阅卷方法及装置
试卷阅卷方法 模板匹配技术 考试录像视频 答题 编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号