一种基于复杂任务的高质量伪标注数据集构建方法

AITNT
正文
推荐专利
一种基于复杂任务的高质量伪标注数据集构建方法
申请号:CN202510461536
申请日期:2025-04-14
公开号:CN120297445B
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种基于复杂任务的高质量伪标注数据集构建方法,涉及多模态学习技术领域,包括,基于多模态原始数据构建跨模态因果图,并加载领域知识图谱,识别模态间混淆变量,并生成初始伪标签;通过强制切断跨模态因果图中非因果路径生成反事实样本,并对比原始样本与反事实样本的伪标签差异,生成跨模态去偏伪标签;结合跨模态去偏伪标签与语义一致性伪标签,融合生成多模态对齐、实体关系明确且语义一致的标准化伪标注数据集。本发明采用反事实干预框架,通过分析概率分布差异识别并消除跨模态交互中的非因果路径影响,有效抑制虚假关联。
技术关键词
数据集构建方法 跨模态 标签 语义 图谱 样本 多模态 动态 加权平均策略 结构方程模型 模态特征 指数衰减函数 实体 变量 关系 嵌入方法 编码器 节点 滑动窗口 处理器
系统为您推荐了相关专利信息
1
一种基于大模型的报表融合生成标准台账的方法、系统、终端及介质
基准 报表数据处理 生成数据项 可读存储介质 程序
2
一种提示词跟随大模型切换的风格动态适应切换方法
风格 切换方法 答案 文本 度评估方法
3
基于知识图谱增强的多模态变压器故障溯因推理方法及相关系统
图像嵌入 变压器 推理方法 注意力机制 图谱
4
基于MCP协议与工具调用的充电站客服处理方法及装置
业务系统 充电站 自然语言 意图 客服
5
应用于特种设备从业人员的智能题库试题生成方法、系统、装置及设备
题库试题 知识点 特种设备 生成方法 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号