摘要
本发明涉及文本处理技术领域,具体为一种基于肿瘤数据库文本识别的肿瘤预后预测方法,包括以下步骤:基于肿瘤数据库文本,检索匹配预设肿瘤实体、治疗方式、临床症状词汇的字符序列及上下文,获取原始文本匹配片段;基于所述原始文本匹配片段,整合序列位置信息并去除局部文本冗余。本发明中,基于肿瘤数据库文本,通过逐步细化文本匹配与语义消歧处理,采用实体指称序列位置整合和文本冗余剔除操作,提高实体抽取的有效性,精细化地解析了歧义实体与语义上下文之间的关联;在此基础上,通过语义向量距离计算、属性一致性判断及时间间隔衰减的加权融合,挖掘患者指称之间的潜在关联,并依托聚类分析实现了高关联强度指称的汇聚。
技术关键词
肿瘤预后预测
语义实体
文本识别
字符
序列
索引
语义向量
语义结构
图谱
冗余
时序
文本处理技术
事件流
患者
医学
排序结构
系统为您推荐了相关专利信息
综合管理方法
图谱
栽培环境监测
专用采集设备
配置访问权限
冷凝水排放装置
智慧管理平台
数据分析模块
温压传感器
设备故障诊断
薄弱环节识别
隐马尔可夫模型
参数
粒子群优化算法
偏差
特性检测系统
卷积特征提取
动态
局部统计信息
生成集成电路