摘要
本公开的实施例公开了食物描述信息显示方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:接收食物图像和初始食物描述信息;生成图像特征信息;对图像特征信息进行第一动态位置编码;生成文本特征信息;对文本特征信息进行第二动态位置编码;对图像位置特征信息和文本位置特征信息进行融合;检索表征描述食物特征的特征补充信息;基于多模态融合特征信息和特征补充信息,生成目标食物描述信息;从目标音频数据库中获取目标食物描述信息对应的目标食物音频;将目标食物描述信息和目标食物音频发送至用户终端。该实施方式通过多模态特征信息检索的方式,生成更为精准且全面的目标食物描述信息,能更好地满足用户的需求。
技术关键词
位置特征信息
动态位置编码
图像位置特征
图像特征信息
图像块特征
融合特征
分词
多模态
局部特征信息
信息显示方法
音频
元素
生成图像特征
文本生成模型
终端
信息显示装置
系统为您推荐了相关专利信息
遮挡行人检测方法
Sigmoid函数
双线性插值算法
分辨率
注意力
压缩光谱成像方法
单像素探测器
压缩光谱成像系统
可见光信号
可见光光谱
图像特征信息
火情检测方法
预警方法
图像编码
光学图像数据
图像超分辨率方法
噪声图像
矩阵
编码器模块
图像超分辨率重建
地图特征
位置特征信息
关键帧
图像特征信息
地图数据库