基于大模型的解说视频生成方法、装置、设备和介质

AITNT
正文
推荐专利
基于大模型的解说视频生成方法、装置、设备和介质
申请号:CN202511039028
申请日期:2025-07-25
公开号:CN120786152A
公开日期:2025-10-14
类型:发明专利
摘要
本公开提供了一种基于大模型的解说视频生成方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及多模态、自然语言处理、计算机视觉和深度学习等技术领域。该方法包括:获取待处理视频中的多个字幕文本和对应的第一时间戳;基于多个字幕文本的第一时间戳,确定待处理视频中的至少一个无字幕片段和对应的第二时间戳;利用第一多模态大模型对至少一个无字幕片段进行视觉内容理解,得到与至少一个无字幕片段对应的至少一个字幕补全文本;利用大语言模型,基于多个字幕文本和对应的第一时间戳以及至少一个字幕补全文本和对应的第二时间戳,生成针对待处理视频的解说词;以及基于解说词,生成解说视频。
技术关键词
字幕 语义标签 分段 文本 视频生成方法 大语言模型 语义向量 镜头 多模态 生成模板 情感分析模型 视频生成装置 依存句法分析 关键词 处理器 人工智能技术 计算机程序产品
系统为您推荐了相关专利信息
1
基于关键字的搜索方法、装置、介质及设备
关键字 答案 历史搜索信息 搜索方法 服务系统
2
一种多协议单点登录可视化设计系统
可视化设计系统 多协议 转换单元 证书信息 密钥管理
3
一种船舶营销方法及系统
营销方法 船舶 自然语言 多模态 营销系统
4
翻译文稿字数统计方法、装置、计算机设备及存储介质
字数统计方法 图片 OCR识别技术 Visio图形 文本识别
5
一种网络威胁情报分析方法及其系统
威胁情报分析方法 节点 命名实体识别 非易失性存储介质 sigmoid函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号