摘要
本发明提供了一种基于自然语言的建筑视频生成方法和计算机程序产品,涉及人工智能生成技术领域,通过采集多个视角的建筑图像形成第一图像集;对第一图像集进行尺寸统一化处理得到预处理图像集;通过预训练语言模型对预处理图像集进行建筑特征识别,生成特征描述文本形成训练数据集;采用训练数据集对LoRA模型进行训练;将目标建筑的特征描述文本输入训练完成的LoRA模型,生成多个不同视角的建筑图像形成第二图像集;将第二图像集输入视频生成模型生成建筑视频;进行后处理优化;将视频转换为目标输出格式。本发明提高了视频生成的精确匹配度,增强了视频的一致性和连贯性,同时降低了系统资源消耗。
技术关键词
视频生成方法
自然语言
建筑
计算机程序产品
视频生成模型
预训练语言模型
系统资源消耗
损失函数优化
图像处理算法
文本
生成技术
视角
数据
可读存储介质
视频帧
格式
噪声
节点
系统为您推荐了相关专利信息
人流量阈值
监管系统
人流量数据
工作量
监管方法
策略
文本处理模型
文本处理方法
计算机设备
计算机程序产品
光束
湍流环境
多参数调控
自由空间光通信技术
可读存储介质
生成反馈信号
融合特征
多模态特征
Attention机制
文本
加速系统
语义理解模型
多尺度
命名实体识别
匹配模块