一种低成本的多模态文章生成方法

正文

推荐专利

一种低成本的多模态文章生成方法

申请号：CN202510222630

申请日期：2025-02-27

公开号：CN120144739A

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开了一种低成本的多模态文章生成方法，包括：获取用户输入数据，为目标文本数据，或，为目标文本数据和目标图像数据；将目标文本数据输入至经过Lora微调的Stable Diffusion‑XL模型中，生成m张图像数据；将m张图像数据进行融合，或，将目标图像数据与m张图像数据进行融合，生成融合特征；将目标文本数据、融合特征分别和m张图像数据输入至训练并优化好的High‑class corpus生成模型中，输出对应的m条目标语料；将m条目标语料和目标文本数据输入至本地的WriterLLM模块中，生成多模态文章。通过该方法，可通过本地小参数LLM扩充图像模态的信息量，并输出高质量预料。

技术关键词

文章生成方法融合特征多张图像数据视觉特征提取文本低成本注意力条目模块多模态关键字编码器策略解码器参数矩阵

系统为您推荐了相关专利信息

三维模型属性绑定方法、系统、设备、介质和产品

绑定方法深度图图像编码器交叉注意力机制图片

图像审核方法、装置、设备及计算机介质

审核方法文本识别模型计算机程序指令计算机视觉识别文本检测模型

基于大模型微调与多模态RAG技术的海洋石油专业智能问答系统

智能问答系统文本段落大语言模型海洋智能问答方法

一种数据检索方法、装置、电子设备及存储介质

数据检索方法语句序列分词方法索引

一种无需微调的多文本长视频生成方法

视频生成方法队列注意力文本模块

一种低成本的多模态文章生成方法

站点导航

APP 下载