摘要
本发明属于自然语言处理技术领域,公开了多层次中医古籍症状标准化处理方法,包括:获取中医古籍文本提取初始症状表述;针对复合症状采用预设规则引擎及大语言模型相结合的方式进行拆分,得到单一症状表述;基于预设的标准症状词库计算单一症状表述的多维相似度,加权融合得到综合相似度得分,若所述综合相似度得分不低于预设阈值,则从所述标准症状词库中确定一个对应的标准症状,作为所述初始症状表述的标准化表达;否则对所述单一症状表述进行聚类,将其归入一个症状簇作为其标准化表达。本发明确保了所有从古籍中提取出的症状信息都得到有效处理和归类,构建了一个真正完整的古代症状知识体系。
技术关键词
预训练语言模型
多层次
机器翻译模型
文本
计算方法
语义
标注规则
预训练模型
大语言模型
术语
自然语言
聚类
数据
身体
词典
编辑
符号
模板
定义