大模型的训练方法、视频处理方法、装置及相关设备

正文

推荐专利

申请号：CN202411071796

申请日期：2024-08-06

公开号：CN119026075A

公开日期：2024-11-26

类型：发明专利

摘要

本申请提供一种大模型的训练方法、视频处理方法、装置及相关设备，该方法包括：对样本视频进行预处理，得到多个视频帧、时间戳指令文本和任务指令文本；对时间戳指令文本和任务指令文本进行分词，得到时间戳指令分词文本和任务指令分词文本；对多个视频帧、时间戳指令分词文本和任务指令分词文本进行特征转换，得到第一目标特征；使用第一目标特征对预设大模型进行指令调整，得到目标大模型。本申请通过将样本视频进行预处理后得到多个视频帧、时间戳指令文本和任务指令文本，并由此进行特征融合和转换，得到第一目标特征并对预设大模型进行指令调整，得到目标大模型，更好地考虑视频动作和文本描述的关系，提高了大模型对视频处理的准确度。

技术关键词

文本编码特征分词视频帧指令音频生成方法计算机程序产品图像特征提取模型滑动窗口样本答案生成应用程序模版处理器模块编码器训练装置存储器

系统为您推荐了相关专利信息

一种3D车道线检测方法及装置

车道线检测方法语义特征矩阵图片场景

用于密码卡的防拆电路及密码卡组件

微动开关单片机密码卡存储模块电源输入端

基于多模态大语言模型的无人机集群编队控制方法和系统

大语言模型领航无人机指令命令语义

宫颈癌风险诊断系统

宫颈细胞病理风险预测模型宫颈癌发病风险融合特征文本

基于多智能协作的增强上下文窗口的智能情报整编方法

智能协作智能主题大语言模型追踪方法模板

大模型的训练方法、视频处理方法、装置及相关设备

站点导航

APP 下载