摘要
本发明提供一种文本语义分块方法、设备、存储介质和计算机程序产品,涉及文本信息处理技术领域,该方法包括:对待分块的文本进行多模态语义分析,生成多个语义单元;根据各语义单元构建动态图谱,对动态图谱中的各节点进行聚类,得到聚类结果;根据聚类结果,构建层次化聚类树;对层次化聚类树进行切割,得到待分块的文本的语义分块结果。通过动态图谱构建与智能聚类分块机制,解决分块技术语义割裂与规则僵化的问题,同时通过层次化聚类树动态调节分块粒度,提高文本分块的语义关联度,实现动态适应复杂文本结构和领域特异性需求。
技术关键词
分块方法
聚类
节点
图谱
计算机程序产品
文本信息处理技术
动态
非暂态计算机可读存储介质
轮廓系数
语义角色标注
多模态
语义关联度
命名实体识别
分块技术
分块策略
处理器
系统为您推荐了相关专利信息
制造商
特征提取单元
数据存储单元
模块
数据采集单元
数字孪生模型
修复方法
调度算法
神经网络模型
感应发电机
资源管理系统
资源分配模块
可视化操作界面
接口模块
数据融合算法
节点状态评估
参数
语句
分布式存储系统
新增磁盘