基于跨模态对齐的弱监督扒渣终点判断方法和系统

AITNT
正文
推荐专利
基于跨模态对齐的弱监督扒渣终点判断方法和系统
申请号:CN202410820785
申请日期:2024-06-24
公开号:CN118552878B
公开日期:2025-04-18
类型:发明专利
摘要
本发明公开一种基于跨模态对齐的弱监督扒渣终点判断方法和系统,包括:接入当前扒渣现场摄像头,将实时视频流数据输入训练完成的视频数据处理器;视频数据处理器以每一当前帧为基准,将包括当前帧在内向前共若干帧数据进行切割打包,输出当前帧的实时视频片段,作为训练完成的跨模态特征提取器的视频模态输入,同时以当前钢种文本编号和“非终点”文本作为跨模态特征提取器的文本模态输入;跨模态特征提取器提取视频片段特征和文本特征,将提取的视频片段特征和文本特征输入特征比对决策模块进行特征比对,最终输出当前帧是否为对应当前钢种扒渣终点的判断结果。本发明可以对扒渣终点进行准确判断。
技术关键词
跨模态 特征提取器 视觉特征 数据处理器 终点判断方法 视频特征提取 文本编码器 语义 模块 实时视频流 样本 词嵌入模型 融合视觉 时序 分词
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号