一种迭代式多粒度文档的切分方法

正文

推荐专利

一种迭代式多粒度文档的切分方法

申请号：CN202510184159

申请日期：2025-02-19

公开号：CN120181069A

公开日期：2025-06-20

类型：发明专利

摘要

本发明涉及人工智能识别技术领域，尤其是提供了一种迭代式多粒度文档的切分方法。该方法包括构建训练语料，并对其进行段、词和句不同粒度的切分，由未切分文档和切分文档组成训练语料；通过训练语料训练GPT结构的深度学习模型，获得训练后的切分模型；根据训练后的切分模型对输入文档进行切分，输出切分结果，该方法解决了多粒度切分无法统一的问题，提高了文档整体的切分语义和切分结果。

技术关键词

人工智能识别技术深度学习模型可读存储介质字符计算机代表存储器算法电子设备指令语义处理器程序

系统为您推荐了相关专利信息

AIS卫星的星座轨道确定方法、装置、设备及存储介质

船舶报告蒙特卡罗算法数据轨道

基于鲁棒性评估的网络流量分类方法、系统、设备及介质

网络流量数据鲁棒性评估网络流量分类方法网络流量分类系统网络流量分类模型

医生调度方法、系统、设备及介质

诊断特征患者特征提取模型疾病调度系统

一种用于异构的分布式装配置换流水车间节能调度方法

流水车间节能调度方法节能调度模型工件协同进化算法

基于车轨路地耦合模型批量化建立层间接触的方法

ANSYS软件铁路工程计算机辅助设计技术子系统批量动态子结构

一种迭代式多粒度文档的切分方法

站点导航

APP 下载