基于语义识别的大模型的训练数据冗余剔除方法及系统

AITNT
正文
推荐专利
基于语义识别的大模型的训练数据冗余剔除方法及系统
申请号:CN202510472445
申请日期:2025-04-16
公开号:CN119988842B
公开日期:2025-08-01
类型:发明专利
摘要
本发明涉及自然语言处理技术领域,本发明公开了基于语义识别的大模型的训练数据冗余剔除方法及系统,包括通过构建领域知识图谱,实现对数据中冗余部分的精确识别和剔除,结合图神经网络等先进技术,提升了数据预处理的质量和效率。相较于现有技术,本发明通过采用多层次的数据编码和特征传播机制,不仅有效消除了数据中的冗余信息,还促进了数据的高维表征,使得数据在进入模型训练阶段前具备更高的解释能力和准确性。
技术关键词
剔除方法 数据冗余 节点 高维特征向量 知识图谱构建 邻居 标记 实体 多模态信息融合 知识图谱分析 语义识别技术 语义向量 数据清洗算法 神经网络架构 度度量方法 核心
系统为您推荐了相关专利信息
1
一种电网领域大模型的部署方法及系统
内存 深度学习模型 深度学习框架 硬件设备信息 优化器
2
模式选择电路及方法、驱动芯片、显示器
晶体管 反相器单元 节点 发光显示面板 驱动芯片
3
一种补偿热凸度的厚板轧机工作辊辊型曲线的优化方法
工作辊辊型 辊型曲线 厚板轧机 方程 神经网络方法
4
一种恶劣天气下的飞行计划动态生成方法及系统
动态生成方法 动态生成模型 航空器 计划 气象雷达数据
5
基于IGOOSE优化BP神经网络的RSSI测距算法
优化BP神经网络 测距算法 接收信号强度指示 卡尔曼滤波 路径损耗模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号