摘要
本发明涉及自然语言处理技术领域,本发明公开了基于语义识别的大模型的训练数据冗余剔除方法及系统,包括通过构建领域知识图谱,实现对数据中冗余部分的精确识别和剔除,结合图神经网络等先进技术,提升了数据预处理的质量和效率。相较于现有技术,本发明通过采用多层次的数据编码和特征传播机制,不仅有效消除了数据中的冗余信息,还促进了数据的高维表征,使得数据在进入模型训练阶段前具备更高的解释能力和准确性。
技术关键词
剔除方法
数据冗余
节点
高维特征向量
知识图谱构建
邻居
标记
实体
多模态信息融合
知识图谱分析
语义识别技术
语义向量
数据清洗算法
神经网络架构
度度量方法
核心
系统为您推荐了相关专利信息
内存
深度学习模型
深度学习框架
硬件设备信息
优化器
工作辊辊型
辊型曲线
厚板轧机
方程
神经网络方法
动态生成方法
动态生成模型
航空器
计划
气象雷达数据
优化BP神经网络
测距算法
接收信号强度指示
卡尔曼滤波
路径损耗模型