非结构化文本数据的计算方法及系统

AITNT
正文
推荐专利
非结构化文本数据的计算方法及系统
申请号:CN202510076252
申请日期:2025-01-17
公开号:CN119474383B
公开日期:2025-05-16
类型:发明专利
摘要
本发明提供非结构化文本数据的计算方法及系统,涉及自然语言处理技术领域,包括对输入的非结构化文本数据进行多层级处理,根据词频分布动态调整分词粒度,并结合上下文语义信息构建词性共现矩阵,提取实体信息,融合词性共现矩阵和实体信息生成层次化语义标签序列。采用不同卷积核尺寸的特征提取单元提取特征表示,并计算不同语义层次间余弦相似度建立关联权重矩阵。基于实体信息构建语义增强向量,并进行对抗训练,得到多模态语义特征矩阵。计算融合特征向量间的语义相似度进行聚类,并根据类簇的复杂度、一致性和模糊度设定难度权重排序后输入分类器,迭代优化分类结果,得到计算结果。
技术关键词
噪声强度系数 层次化语义 非结构化文本 样本 上下文语义信息 分词 分类器参数 训练分类器 语义特征 随机噪声 特征提取单元 实体 序列 特征提取器 转移概率矩阵 局部敏感哈希方法 复杂度
系统为您推荐了相关专利信息
1
一种多传感器监测的滑坡预警方法、装置、设备及介质
滑坡预警方法 传感器监测 多传感器 监测边坡 环境传感器
2
一种径流预测及水电-氢系统的联合调度方法及装置
水电站 径流 联合调度方法 数据 能源
3
基于模糊层次综合法与有监督学习的地下空间适宜性评估方法
BP神经网络模型 综合法 模糊综合评价法 三维地质模型 城市地下空间
4
大语言模型的请求处理方法及装置
大语言模型 序列 广度优先搜索算法 深度优先搜索算法 文本
5
非道路工程机械瞬态排放的预测方法及装置
非道路工程机械 多层LSTM模型 环境相对湿度 样本 预测装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号