一种低成本的多模态文章生成方法

AITNT
正文
推荐专利
一种低成本的多模态文章生成方法
申请号:CN202510222630
申请日期:2025-02-27
公开号:CN120144739A
公开日期:2025-06-13
类型:发明专利
摘要
本发明公开了一种低成本的多模态文章生成方法,包括:获取用户输入数据,为目标文本数据,或,为目标文本数据和目标图像数据;将目标文本数据输入至经过Lora微调的Stable Diffusion‑XL模型中,生成m张图像数据;将m张图像数据进行融合,或,将目标图像数据与m张图像数据进行融合,生成融合特征;将目标文本数据、融合特征分别和m张图像数据输入至训练并优化好的High‑class corpus生成模型中,输出对应的m条目标语料;将m条目标语料和目标文本数据输入至本地的WriterLLM模块中,生成多模态文章。通过该方法,可通过本地小参数LLM扩充图像模态的信息量,并输出高质量预料。
技术关键词
文章生成方法 融合特征 多张图像数据 视觉特征提取 文本 低成本 注意力 条目 模块 多模态 关键字 编码器 策略 解码器 参数 矩阵
系统为您推荐了相关专利信息
1
三维模型属性绑定方法、系统、设备、介质和产品
绑定方法 深度图 图像编码器 交叉注意力机制 图片
2
图像审核方法、装置、设备及计算机介质
审核方法 文本识别模型 计算机程序指令 计算机视觉识别 文本检测模型
3
基于大模型微调与多模态RAG技术的海洋石油专业智能问答系统
智能问答系统 文本段落 大语言模型 海洋 智能问答方法
4
一种数据检索方法、装置、电子设备及存储介质
数据检索方法 语句 序列 分词方法 索引
5
一种无需微调的多文本长视频生成方法
视频生成方法 队列 注意力 文本 模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号