摘要
本申请涉及一种基于大语言模型的交互式图像处理方法及装置。该方法包括:在用户端按照预设布局显示输入区,交互区,结果展示区和插件区;在所述输入区获取用户的输入信息,所述输入信息包括以下信息中的一个或多个:文本信息、语音信息、图像信息;大语言模型解析所述输入信息,根据所述输入信息执行处理并生成图像形式和文字形式的输出结果;将图像形式的输出结果展示在所述结果展示区;将文字形式的输出结果展示在所述交互区;由插件区和/或输入区和/或结果展示区获取用户的输入信息,根据所述输入信息对图像形式的输出结果进行后续处理。本申请涉及的基于大语言模型的交互式图像处理方法及装置,能够通过仿人交互方式,结合插件化功能扩展,实现了低门槛、高灵活性和直观操作的图像生成与编辑体验。
技术关键词
大语言模型
输入区
插件
图像
文本
语音
多层次
生成文字
指令
布局
意图
输入模块
门槛
编辑
参数
动态
系统为您推荐了相关专利信息
地图构建方法
物体
机器人控制系统
计算机可读取存储介质
图像