摘要
一种支持细粒度定制的故事可视化方法,包括:输入参考图像与叙事文本,通过身份解耦编码器分离参考图像的身份特征与非身份可编辑属性,利用故事语义解析器解析叙事文本时序属性变化趋势生成调节参数,经跨模态融合控制器融合生成细粒度控制特征,再由跨帧一致性维护模块结合扩散模型生成时序连贯图像序列,最终输出符合细粒度属性控制与跨帧身份一致性的结果。相比现有方法,本发明的显著优势在于通过四阶段处理,解决了身份保真与动态属性调节矛盾,保障了多帧时空连贯,核心指标全面超越了基线方法,为单参考图像下的高保真故事可视化提供了完整解决方案。
技术关键词
融合控制器
身份
可视化方法
交叉注意力机制
解析器
图像
跨模态
编辑
语义特征
文本编码器
时序
大语言模型
计算机程序产品
连续性
键值
系统为您推荐了相关专利信息
轨迹
动态优先级队列
光照
BFGS算法
双目相机
深部地下工程
围岩松动圈
可视化方法
CT扫描图像
三维模型
智能合约代码
抽象语法树
风险评估报告
零知识证明
构建智能合约