摘要
本发明属于自然语言处理技术领域,公开了基于大语言模型的中医古籍症状标准化处理方法,包括:获取并预处理中医古籍文本,提取初始症状表述;针对初始症状表述中存在的复合症状,采用预设规则引擎及大语言模型相结合的方式进行拆分,得到单一症状表述;基于预设的标准症状词库,计算单一症状表述的多维相似度;对多维相似度进行加权融合得到综合相似度得分,基于综合相似度得分从标准症状词库中确定一个对应的标准症状,将其作为初始症状表述的标准化表达。本发明通过多维度的校验机制,能够有效克服因“同症异名”、用词习惯差异等造成的匹配失败问题,其准确性和鲁棒性远超仅依赖单一语义匹配的现有技术。
技术关键词
预训练语言模型
大语言模型
机器翻译模型
文本
语义
计算方法
标注规则
预训练模型
校验机制
术语
自然语言
鲁棒性
数据
身体
词典
编辑
习惯
符号
模板
系统为您推荐了相关专利信息
语义标签
博弈算法
GIS数据库
监测方法
设备可读存储介质