摘要
本发明提供一种长文本内容的配图方法、装置、电子设备及存储介质,该长文本内容的配图方法通过将待配图文本内容输入自然语言理解大模型,生成内容深度理解结果;基于深度理解结果执行多级联动配图策略;对候选图像进行相关性评估,根据评估结果输出最优配图;其中,多级联动配图策略包括在本地图库中基于语义向量相似度进行首轮检索;当首轮检索结果不满足预设相关性阈值时,触发在线图库的扩展检索;当所述扩展检索仍不满足要求时,生成适配的文本描述并调用图像生成模型创建新图像,能够准确捕捉长文本的核心主旨,解决语义鸿沟问题,在保证检索效率的同时,逐步扩大检索范围或生成高匹配度图像,提高配图获取的成功率和适配性。
技术关键词
配图方法
自然语言理解
图表
文本
图像生成模型
图片
语义向量
策略
非暂态计算机可读存储介质
多模态
关键词
在线
电子设备
处理器
跨模态
输入模块
输出模块
存储器
系统为您推荐了相关专利信息
知识网络构建方法
文档对象模型
实体
网络构建系统
知识关系构建
实时语音
音频采集模块
语音识别模块
识别系统
自动语音识别
语音交互控制方法
语音交互控制系统
语音识别模型
耳鼻喉手术
动力设备