摘要
本申请实施例公开了一种文档处理方法及装置。主要技术方案包括:获取待处理的文档;对所述文档进行解析,依据解析结果和所述文档的结构构建所述文档对应的文档树;从所述文档树的叶节点开始,调用第二大语言模型逐层进行迭代总结,直至得到根节点的总结结果;其中,叶节点的总结结果是第二大语言模型利用叶节点的文本内容推理得到的,非叶节点的总结结果是第二大语言模型利用该非叶节点的子节点的总结结果推理得到的;利用所述根节点的总结结果,得到所述文档的总结结果。本申请基于文档的结构将总结任务拆解为多级任务,大语言模型能够更好的理解文档各部分的语义内容以及各部分之间的结构关系,进而得到高质量的总结结果。
技术关键词
大语言模型
节点
富文本
管理系统
存储程序指令
处理器
计算机程序产品
云端服务器
解析单元
页面
可读存储介质
分段
存储器
终端
电子设备
语义
系统为您推荐了相关专利信息
作业调度方法
负载均衡策略
分配信息
历史运行信息
指标
图像检测模型
图像采集设备
云端
多模态
计算机程序产品
耕地变化检测方法
多任务损失函数
压缩特征
变化检测模型
遥感影像数据
工业互联网系统
视觉检测模块
人机交互模块
智能控制模块
数据分析模块