摘要
本申请实施例公开了一种视频标题生成方法及装置。其中,方法包括:获取待处理视频中的多模态数据,其中,多模态数据包含:视频帧及音频数据;根据多模态数据确定视频标题提示关键词,并根据视频标题提示关键词,生成视频标题提示信息,将视频标题提示信息及多模态数据输入至预先训练的多模态大语言模型,生成待处理视频对应的视频标题。由此,可以利用多模态大语言模型结合视频内容的多模态数据自动生成视频标题,使得所生成的视频标题与视频内容高度契合,所生成的视频标题既能准确反映视频内容又能吸引用户点击,从而提高了视频稿件的生产效率及分发效果,提升用户体验度,同时还节省了人力物力成本。
技术关键词
关键词
多模态
大语言模型
生成方法
标签
视频元数据
图像
视频评论信息
音频特征
通信接口
生成字幕
处理器
计算机存储介质
语句
指令
计算机程序产品
样本
系统为您推荐了相关专利信息
多模态深度学习
早期筛查方法
面部表情特征
风险评估模型训练
早期筛查系统
老年认知障碍
个性化认知训练
区块链数据共享
语音信号处理技术
行走步态
多模态数据融合
数据采集模块
数据处理模块
方程
农业数据处理技术