一种迭代式多粒度文档的切分方法

AITNT
正文
推荐专利
一种迭代式多粒度文档的切分方法
申请号:CN202510184159
申请日期:2025-02-19
公开号:CN120181069A
公开日期:2025-06-20
类型:发明专利
摘要
本发明涉及人工智能识别技术领域,尤其是提供了一种迭代式多粒度文档的切分方法。该方法包括构建训练语料,并对其进行段、词和句不同粒度的切分,由未切分文档和切分文档组成训练语料;通过训练语料训练GPT结构的深度学习模型,获得训练后的切分模型;根据训练后的切分模型对输入文档进行切分,输出切分结果,该方法解决了多粒度切分无法统一的问题,提高了文档整体的切分语义和切分结果。
技术关键词
人工智能识别技术 深度学习模型 可读存储介质 字符 计算机 代表 存储器 算法 电子设备 指令 语义 处理器 程序
系统为您推荐了相关专利信息
1
AIS卫星的星座轨道确定方法、装置、设备及存储介质
船舶 报告 蒙特卡罗算法 数据 轨道
2
基于鲁棒性评估的网络流量分类方法、系统、设备及介质
网络流量数据 鲁棒性评估 网络流量分类方法 网络流量分类系统 网络流量分类模型
3
医生调度方法、系统、设备及介质
诊断特征 患者 特征提取模型 疾病 调度系统
4
一种用于异构的分布式装配置换流水车间节能调度方法
流水车间 节能调度方法 节能调度模型 工件 协同进化算法
5
基于车轨路地耦合模型批量化建立层间接触的方法
ANSYS软件 铁路工程计算机辅助设计技术 子系统 批量 动态子结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号