摘要
本申请公开了一种基于AI GC技术的交互式三维动画生成方法及系统,其通过对用户输入的动画草图和自然语言描述进行跨模态联合理解,并基于此生成初步的三维动画低保真预览图;接着,通过引入结构化场景解码机制,将复杂的动画意图多模态联合特征解析为包含一系列细化交互模块的结构化场景描述,以将宏观的动画意图分解为可供用户精确干预的局部单元,用户可针对这些特定的细化交互模块发出具体的细化指令,系统接收指令后更新结构化场景描述,并基于更新后的结构化场景描述,生成更新的三维动画预览图。这样,使得用户能够对动画进行针对性的、精细化的调整,极大地增强了动画生成的可控性和灵活性,有效解决了传统AI GC方案中细节调整难的问题。
技术关键词
结构化场景
局部视觉特征
三维动画生成方法
编码向量
自然语言
多模态
跨模态
意图
语义特征
模块
多尺度
列表
RNN模型
编码器
解码机制
效应