非结构化文本数据的计算方法及系统

正文

推荐专利

非结构化文本数据的计算方法及系统

申请号：CN202510076252

申请日期：2025-01-17

公开号：CN119474383B

公开日期：2025-05-16

类型：发明专利

摘要

本发明提供非结构化文本数据的计算方法及系统，涉及自然语言处理技术领域，包括对输入的非结构化文本数据进行多层级处理，根据词频分布动态调整分词粒度，并结合上下文语义信息构建词性共现矩阵，提取实体信息，融合词性共现矩阵和实体信息生成层次化语义标签序列。采用不同卷积核尺寸的特征提取单元提取特征表示，并计算不同语义层次间余弦相似度建立关联权重矩阵。基于实体信息构建语义增强向量，并进行对抗训练，得到多模态语义特征矩阵。计算融合特征向量间的语义相似度进行聚类，并根据类簇的复杂度、一致性和模糊度设定难度权重排序后输入分类器，迭代优化分类结果，得到计算结果。

技术关键词

噪声强度系数层次化语义非结构化文本样本上下文语义信息分词分类器参数训练分类器语义特征随机噪声特征提取单元实体序列特征提取器转移概率矩阵局部敏感哈希方法复杂度

系统为您推荐了相关专利信息

一种多传感器监测的滑坡预警方法、装置、设备及介质

滑坡预警方法传感器监测多传感器监测边坡环境传感器

一种径流预测及水电-氢系统的联合调度方法及装置

水电站径流联合调度方法数据能源

基于模糊层次综合法与有监督学习的地下空间适宜性评估方法

BP神经网络模型综合法模糊综合评价法三维地质模型城市地下空间

大语言模型的请求处理方法及装置

大语言模型序列广度优先搜索算法深度优先搜索算法文本

非道路工程机械瞬态排放的预测方法及装置

非道路工程机械多层LSTM模型环境相对湿度样本预测装置

非结构化文本数据的计算方法及系统

站点导航

APP 下载