摘要
本发明公开了一种用于医学报告结构化信息提取与隐私保护的处理方法,涉及医学报告处理领域,其通过集成先进的图像预处理、动态版面分析、OCR技术、以及双通道隐私检测模型,能够高效准确地提取表格中的文本信息,并建立影像描述段落与对应图像之间的坐标映射关系;生成的包含文本、表格及图文映射关系的JSON结构保证了数据的完整性和准确性;解决了现有技术在处理复杂排版医学文档时遇到的数据错位、上下文割裂以及隐私泄露等问题;此外,以Qwen模型为基础构建改进的Transformer框架,并注入逻辑推理链,同时通过集成临床诊断规则和多模态对比学习策略训练得到病例读取大模型,利用该模型生成高质量的结构化摘要,极大的提高了摘要生成的准确性。
技术关键词
图像
表格
医学
报告
JSON结构
差分隐私机制
文本段落
多头注意力机制
摘要
标注策略
指标
Sigmoid函数
跨模态
图文
语义
数据
网络
集成临床