一种面向多模态大模型的图像压缩方法

AITNT
正文
推荐专利
一种面向多模态大模型的图像压缩方法
申请号:CN202511461050
申请日期:2025-10-14
公开号:CN120935361A
公开日期:2025-11-11
类型:发明专利
摘要
本发明提供了一种面向多模态大模型的图像压缩方法,包括:步骤S1,获取任一待压缩图像,基于预训练视觉模型对待压缩图像进行浅层特征提取并生成语义重要性图;步骤S2,对待压缩图像进行编码并根据语义重要性图指导编码过程中的比特率分配,同时生成压缩比特流;步骤S3,对压缩比特流进行解码获得低层级重建图像,基于潜在特征适配器对低层级重建图像的潜在特征进行高层级语义增强得到增强后潜在特征,并将增强后潜在特征与从低层级重建图像中提取到的低层级特征进行融合,生成供多模态大模型使用的压缩重建图像。有益效果是本发明能够实现在高效压缩的同时最大程度地维持多模态大模型处理图像的性能。
技术关键词
图像压缩方法 压缩比特流 多模态 语义 图像块 层级 注意力 浅层特征提取 适配器 视觉 编码 解码 误差 局域 网络 分层 基准 策略 机制
系统为您推荐了相关专利信息
1
一种基于深度学习的锂硫电池异常发热诊断方法与系统
诊断方法 电压补偿 时序特征 锂硫电池 温升
2
一种基于智能推荐模型的业务投放分析方法和系统
游艺用品 投放分析方法 多模态 生成业务 度量
3
一种基于知识图谱的核电领域项目管理方法及系统
项目管理方法 计划 图谱 编码规则 概念
4
网页内容提取方法以及电子设备
网页内容提取方法 标签 语义相关度 布局 层叠样式表
5
一种消防移动机器人空地协同导航方法、设备、介质及产品
空地协同 火灾现场 图像语义分割网络 导航方法 全局路径规划
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号