基于扩散模型的半监督自然语言时序定位方法及相关装置

正文

推荐专利

申请号：CN202510491814

申请日期：2025-04-18

公开号：CN120411851A

公开日期：2025-08-01

类型：发明专利

摘要

本发明属于计算机视觉与模式识别技术领域，公开了一种基于扩散模型的半监督自然语言时序定位方法及相关装置；其中，所述基于扩散模型的半监督自然语言时序定位方法包括：获取文本描述和待时序定位的视频数据，分别进行特征提取以获得文本特征和视频特征；基于文本特征和视频特征，利用预先训练的时序定位模型进行时序定位，获得时序定位结果；其中，时序定位结果包括文本描述在待时序定位的视频数据中对应的视频片段的开始时间和结束时间。本发明公开的技术方案，将扩散模型集成到教师‑学生框架中，通过加噪和去噪过程提高了伪标签的质量和可靠性，能够提升半监督自然语言时序定位的整体性能。

技术关键词

无标签数据时序编码器模块融合特征编码解码器自然语言定位方法文本视频学生教师噪声数据跨度预训练模型模型更新

系统为您推荐了相关专利信息

水运基础设施多模态数据融合的智能监测方法

多模态数据融合智能监测方法光纤光栅应变健康评估指标光纤光栅传感器阵列

自动化生产线的数据监控方法、装置、设备和存储介质

精度自动化生产线数据监控装置排产计划冗余

一种多能源电力系统的容量配置优化方法及系统

容量配置优化方法气象历史负荷数据冗余多能源

一种能量优化调度方法、系统、终端及存储介质

能量优化调度方法设备健康状态设备状态信息能源消耗设备多源数据融合技术

车辆控制方法及车辆

车辆行驶轨迹预测障碍物轨迹预测地图元素车辆控制方法图像特征信息

基于扩散模型的半监督自然语言时序定位方法及相关装置

站点导航

APP 下载