摘要
本发明提供一种针对文本到视频生成的检索增强提示词优化方法,包括:通过预训练的句子转换模型提取输入的简略提示的特征;对所述简略提示的特征和关系图进行余弦相似度计算,根据计算结果从所述关系图中检索出与所述简略提示最相关的修饰词集合;采用双分支优化策略对所述简略提示和修饰词集合进行处理,得到候选提示;通过微调的判别模型对上述两个分支生成的候选提示进行比较与选择,得到最优提示。本发明的方法解决了简略提示信息不足的问题,优化后的提示使生成的视频在内容丰富性、画面细节以及动作连贯性上均能得到显著提升。
技术关键词
分支
数据分布
计算机存储介质
文本
视频
关系
特征提取模块
大语言模型
融合策略
处理器
重构
数据格式
存储器
子系统
电子设备
画面
场景
系统为您推荐了相关专利信息
长短期记忆网络
语音
标签
训练样本集
模型训练装置
特征参数提取方法
空间关系特征
局部纹理特征
计算机视觉
可调谐激光源
特性分析方法
Hessian矩阵
阻尼
电压
因子
文本
图像预测方法
噪声图像
融合特征
模型训练方法