面向正负样本不平衡的医疗知识库语义匹配方法及装置

AITNT
正文
推荐专利
面向正负样本不平衡的医疗知识库语义匹配方法及装置
申请号:CN202510973096
申请日期:2025-07-15
公开号:CN120994772A
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开了一种面向正负样本不平衡的医疗知识库语义匹配方法及装置,包括:获取医疗场景对话中的搜索词和客户问句并结合医疗知识库中的匹配问句构建得到训练数据;分别提取训练数据中的样本对的主题和意图并得到主题与意图一致性分类结果;根据训练数据中的样本对的相似性标签、主题与意图一致性分类结果以及第一相似度向量构建基于主题意图一致性约束的焦点损失函数,基于学生模型和教师模型构建蒸馏损失函数,基于焦点损失函数和蒸馏损失函数构建总损失函数,利用总损失函数完成从教师模型到学生模型的知识蒸馏,得到经训练的学生模型;利用该经训练的学生模型进行语义匹配。本发明解决医疗对话数据的分布失衡导致模型预测准确率低的问题。
技术关键词
语义匹配方法 焦点损失函数 样本 意图 主题 学生 蒸馏 医疗场景 教师 客户 搜索词 数据 DBSCAN聚类算法 标签 投影特征 编码器 处理器 大语言模型 多层感知机
系统为您推荐了相关专利信息
1
马尾松SNP分子标记组合及其应用
全基因组芯片 马尾松 全基因组关联分析 种质资源鉴定 标记
2
基于迁移学习和对偶学习的轴承故障诊断方法及系统
轴承故障诊断方法 预测类别 样本 采集现场 轴承故障诊断系统
3
基于新能源出力误差采样校准的双层滚动精准调度方法
风光 微型燃气轮机 预测误差 电热锅炉 精准调度方法
4
一种介入治疗患者围手术期疼痛数据分析方法及系统
围手术期 数据分析方法 患者 基因 强度
5
一种基于大语言模型的APT攻击检测方法
攻击检测方法 大语言模型 恶意实体 评分机制 多模型协同
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号