摘要
本公开提供了数据处理方法、训练方法及内容识别方法及装置,涉及人工智能技术领域,尤其涉及深度学习、大模型以及内容识别等技术领域。该数据处理方法的具体实现方案为:利用大模型对初始文本序列进行修正和语义切分,生成目标文本序列;基于初始文本序列与目标文本序列之间的第一相似度和初始时间戳,确定各目标文本的目标时间戳;根据各目标文本的目标时间戳,从待处理视频和目标文本序列中确定多个图文对;以及将多个图文对进行图文交替排列,生成用于训练多模态大模型的样本数据。
技术关键词
序列
图文
多模态
内容识别方法
数据处理方法
语义
样本
视频帧
处理器
数据处理装置
规划
人工智能技术
对齐模块
计算机程序产品
文本识别
动态
系统为您推荐了相关专利信息
负荷调节控制方法
信息熵
柔性
存储单元
遗传算法
智能辅助驾驶系统
控制误差
交互方法
拖轮
避障路径