摘要
本申请公开了一种基于大模型的病例数据模拟生成方法、系统及介质,主要涉及病例数据模拟技术领域,用以解决现有的模拟范式生成的数据质量不高,需要人工验证拟合数据是否偏离真实数据、模拟范式在拟合过程中难以捕捉复杂生物系统中的非线性交互关系的问题。包括:提取实际病历数据的分布特征和预设变量之间的关联关系;获得预设聚类数量个第一聚类中心;获取模拟病例数据的提示词,利用大模型模拟生成预设数量的拟合病历数据;将拟合病历数据添加至实际病历数据,获得总病历数据,获得预设聚类数量个第二聚类中心;计算第一聚类中心与对应第二聚类中心之间的距离,当预设聚类数量个距离均小于预设最大距离时,确定拟合病历数据合格。
技术关键词
病历
关系分析程序
模拟生成方法
分布特征
聚类算法
数据管理
非易失性计算机存储介质
数据屏蔽
生成系统
数据模拟技术
模型算法
变量
初始聚类中心
终端
关键词
效应
系统为您推荐了相关专利信息
企业运营管理系统
系统监控模块
频繁模式增长算法
分析模块
数据采集模块
多智能体强化学习
布局优化方法
有向加权网络
层次聚类算法
布局算法
网络附加存储系统
强化学习模型
测试场景
生成方法
系统日志