摘要
本发明实施例涉及计算机视觉技术领域,公开了一种动态压缩图像的方法、装置、设备及存储介质,方法为获取待处理图像的缩略图、第一尺寸相同的第一数量个第一子图以及目标阅读顺序;针对第一数量个第一子图中各第一子图,获取第一比例和第二比例,第一比例为第一子图的文字面积和第一子图面积的比例,第二比例为第一子图的文字数量与文字面积的比例,进而获取第一数量个第一比例和第一数量个第二比例;基于缩略图、第一尺寸、第一数量个第一子图、目标阅读顺序、第一数量个第一比例以及第一数量个第二比例确定出各第一子图对应的第一目标数量个第一视觉token。提高了确定与第一子图对应的预设数量个视觉token的准确性。
技术关键词
缩略图
人工神经网络模型
图像
动态
关系
尺寸
序列
计算机视觉技术
多模态
文本
处理器通信
可读存储介质
存储器
复杂度
电子设备
模块
指令
端点
系统为您推荐了相关专利信息
路由器
智能数据处理
网络管理方法
样本
比例分配公式
数据标注方法
绘制工具
图像编码
解码器
标注工具