摘要
本申请实施例公开了一种文档处理方法及装置。主要技术方案包括:获取待处理的文档;对所述文档进行解析,依据解析结果和所述文档的结构构建所述文档对应的文档树;从所述文档树的叶节点开始,调用第二大语言模型逐层进行迭代总结,直至得到根节点的总结结果;其中,叶节点的总结结果是第二大语言模型利用叶节点的文本内容推理得到的,非叶节点的总结结果是第二大语言模型利用该非叶节点的子节点的总结结果推理得到的;利用所述根节点的总结结果,得到所述文档的总结结果。本申请基于文档的结构将总结任务拆解为多级任务,大语言模型能够更好的理解文档各部分的语义内容以及各部分之间的结构关系,进而得到高质量的总结结果。
技术关键词
大语言模型
节点
富文本
管理系统
存储程序指令
处理器
计算机程序产品
云端服务器
解析单元
页面
可读存储介质
分段
存储器
终端
电子设备
语义
系统为您推荐了相关专利信息
优化设计方案
关键词
阶段
语义检索技术
自然语言
痛风性关节炎
机器学习模型
管理方法
电子健康记录系统
患者