摘要
本申请涉及一种基于AI大模型的新媒体影像处理方法及系统,其包括步骤:获取原始目标影像以及用户交互指令;基于用户交互指令提取处理需求特征以及输出需求特征;通过第一AI大模型对原始目标影像以及处理需求特征进行分析,并生成分级处理策略;通过第二AI大模型基于分级处理策略对原始目标影像进行分级影像处理,获得初始处理影像;基于输出需求特征对初始处理影像进行处理并生成输出目标影像;本申请提出一种基于双AI大模型协同工作的新媒体影像处理方法,通过两个AI大模型的协同配合,实现了从用户意图理解到高质量输出的全流程优化具有增强处理结果泛化能力的效果。
技术关键词
影像
视觉特征
策略
嵌入特征
自然语言解析
媒体
特征提取模块
卷积神经网络提取
通道
纹理特征
语义特征
指令
子模块
跨模态
标识符
风格
机制
识别特征
编码