摘要
本发明公开了基于人工智能的交互式绘画生成方法、系统及装置,涉及人工智能技术领域,通过多模态数据融合、语义对齐、冲突检测与迭代修正,实现高质量图像的生成。方案包括以下核心步骤:获取文本、语音、草图等多模态数据并处理为格式化特征数据集;对多模态特征进行对齐和加权融合,生成统一语义空间特征;利用视觉-文本注意力机制检测图像与文本描述的语义不一致性,生成冲突指数矩阵并触发警报标记;基于统一语义空间特征、冲突指数矩阵和警报标记,迭代修正生成图像。系统由数据采集与预处理、多模态特征对齐与融合、冲突检测与警报、图像生成与迭代修正、系统控制与调度等模块组成。
技术关键词
生成方法
文本
多模态特征
绘画
矩阵
格式化
图像
警报
指数
语音
草图特征提取
融合特征
语义向量
多模态数据融合
数位板
标记