摘要
本公开整体涉及从设备上的媒体资产生成对应于回忆(例如,事件或上下文)的视频。在一些实施方案中,该设备接收基于对回忆的自然语言描述来请求视频的用户输入。该设备向第一机器学习(ML)模型发送该自然语言描述的信息,并且接收查询词元,这些查询词元用于在该设备上寻找与这些查询词元匹配的媒体项。该设备向从这些媒体项确定特质的另一ML模型发送表示所寻找到的媒体项的信息。这些特质被发送到第三ML模型以生成故事大纲,并且该视频是通过将对该故事大纲中的镜头的描述与所寻找到的媒体资产的视觉嵌入进行比较以将它们策划并编排成与该故事大纲一致的该视频来生成的。
技术关键词
媒体项
自然语言
资产
镜头
视频
机器学习模型
设备配置
适配器
视觉特征
指令
服务器
处理器
标记
照片
数据
集群
标识
音乐
系统为您推荐了相关专利信息
辅助信息系统
AI助手
运维知识库
信息系统运维
运维场景
电力计量资产
区块链技术
智能电能表
存证数据
非对称加密算法
互联网医院
缓存策略
通讯方法
语义关联度
移动终端