摘要
本发明提供一种基于AI将商品页面生成视频的方法、装置、设备和介质,方法包括:从电商平台的设定的商品页面中获取商品信息;生成图片描述文本和视频描述文本;将口播提示语、商品信息中的文本数据、图片描述文本以及视频描述文本输入至多模态模型,生成口播文本;将总视频的时长、场景数以及口播文本输入至多模态模型中,将口播文本进行场景分段,得到至少一个场景文本,将每一个场景文本生成对应的音频文件;生成设定格式的视频文件:将视频文件输入至视频编译器,生成所需视频,便于用户快捷的生成所需要的小视频,降低用户的成本。
技术关键词
文本
商品页面
视频
场景切换检测
标识
图片
分段
多模态
音频
格式
生成场景
电商
词语
数据
模块
平台
处理器
可读存储介质
语音
系统为您推荐了相关专利信息
图像类别
融合特征
识别方法
文本
计算机可读指令
代理服务器
多关键词搜索方法
云服务器
加密
标识符
智能家居设备
隐私计算方法
大数据
同态加密技术
学习方式优化
微表情识别
人脸微表情
计算机可执行指令
纹理
特征提取网络