一种基于结构语义融合的智能文档分片方法及系统

AITNT
正文
推荐专利
一种基于结构语义融合的智能文档分片方法及系统
申请号:CN202511003197
申请日期:2025-07-21
公开号:CN120975069A
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及文档智能处理技术领域,公开了一种基于结构语义融合的智能文档分片方法及系统。其中,该方法包括:对目标文档进行结构化解析处理得到统一结构节点树;对统一结构节点树进行语义单元边界识别得到目标切分点;基于目标切分点对目标文档进行约束分片优化得到适配大模型的结构化分片,约束分片优化包括语义质量约束和长度适配约束,语义质量约束被配置为规范分片的语义逻辑关联和上下文衔接关系,长度适配约束被配置为匹配大模型的输入长度上限和处理能力阈值。本发明既保障了分片内容的逻辑完整性;又有效提升了大模型对分片内容的理解效率与处理精度,为后续下游任务提供了高质量的结构化输入基础。
技术关键词
结构语义融合 智能文档 分片方法 业务流程框架 节点 滑动窗口机制 主题 注意力神经网络 层级 逻辑 标签 分片系统 样式 字体 模式识别 格式 场景 识别模块
系统为您推荐了相关专利信息
1
基于语音网关的酒店客房多模态智能客服交互系统
交互系统 资源 语音网关 酒店客房 多模态
2
一种电池管理系统的监测数据分析方法及系统
储能电池 监测数据分析方法 性能预测模型 冷却系统 电池管理系统
3
一种基于类依赖图的应用程序内第三方库检测方法及系统
节点特征 关系 序列 邻居 语义
4
一种玩具汽车电池充电方法及其系统
玩具汽车 无线充电座 电池充电方法 障碍物 节点
5
双录质检方法、装置和计算机设备
智能模型 节点 双录质检方法 界面 计算机设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号