摘要
本发明涉及人工智能识别技术领域,尤其是提供了一种迭代式多粒度文档的切分方法。该方法包括构建训练语料,并对其进行段、词和句不同粒度的切分,由未切分文档和切分文档组成训练语料;通过训练语料训练GPT结构的深度学习模型,获得训练后的切分模型;根据训练后的切分模型对输入文档进行切分,输出切分结果,该方法解决了多粒度切分无法统一的问题,提高了文档整体的切分语义和切分结果。
技术关键词
人工智能识别技术
深度学习模型
可读存储介质
字符
计算机
代表
存储器
算法
电子设备
指令
语义
处理器
程序
系统为您推荐了相关专利信息
网络流量数据
鲁棒性评估
网络流量分类方法
网络流量分类系统
网络流量分类模型
流水车间
节能调度方法
节能调度模型
工件
协同进化算法
ANSYS软件
铁路工程计算机辅助设计技术
子系统
批量
动态子结构