面向正负样本不平衡的医疗知识库语义匹配方法及装置

正文

推荐专利

申请号：CN202510973096

申请日期：2025-07-15

公开号：CN120994772A

公开日期：2025-11-21

类型：发明专利

摘要

本发明公开了一种面向正负样本不平衡的医疗知识库语义匹配方法及装置，包括：获取医疗场景对话中的搜索词和客户问句并结合医疗知识库中的匹配问句构建得到训练数据；分别提取训练数据中的样本对的主题和意图并得到主题与意图一致性分类结果；根据训练数据中的样本对的相似性标签、主题与意图一致性分类结果以及第一相似度向量构建基于主题意图一致性约束的焦点损失函数，基于学生模型和教师模型构建蒸馏损失函数，基于焦点损失函数和蒸馏损失函数构建总损失函数，利用总损失函数完成从教师模型到学生模型的知识蒸馏，得到经训练的学生模型；利用该经训练的学生模型进行语义匹配。本发明解决医疗对话数据的分布失衡导致模型预测准确率低的问题。

技术关键词

语义匹配方法焦点损失函数样本意图主题学生蒸馏医疗场景教师客户搜索词数据 DBSCAN聚类算法标签投影特征编码器处理器大语言模型多层感知机

系统为您推荐了相关专利信息

马尾松SNP分子标记组合及其应用

全基因组芯片马尾松全基因组关联分析种质资源鉴定标记

基于迁移学习和对偶学习的轴承故障诊断方法及系统

轴承故障诊断方法预测类别样本采集现场轴承故障诊断系统

基于新能源出力误差采样校准的双层滚动精准调度方法

风光微型燃气轮机预测误差电热锅炉精准调度方法

一种介入治疗患者围手术期疼痛数据分析方法及系统

围手术期数据分析方法患者基因强度

一种基于大语言模型的APT攻击检测方法

攻击检测方法大语言模型恶意实体评分机制多模型协同

面向正负样本不平衡的医疗知识库语义匹配方法及装置

站点导航

APP 下载