基于多模态大模型的屏幕内容检测方法、系统及存储介质

AITNT
正文
推荐专利
基于多模态大模型的屏幕内容检测方法、系统及存储介质
申请号:CN202510904852
申请日期:2025-07-01
公开号:CN120751179A
公开日期:2025-10-03
类型:发明专利
摘要
本发明提供了一种基于多模态大模型的屏幕内容检测方法、系统及存储介质,该方法包括:屏幕内容图像进行图像预处理,得到待检测图像和待检测文本;将待检测图像输入预训练后的视觉检测大模型进行视觉风险检测,得到视觉风险值,将待检测文本输入预训练后的文本检测大模型进行文本风险检测,得到文本风险值;根据屏幕内容图像的图像类型对视觉风险值和文本风险值进行加权运算,得到目标风险值;若目标风险值大于第一风险阈值,控制目标屏幕开启虚拟专用网络,根据虚拟专用网络控制目标屏幕进行预设内容显示。本发明实施例,通过采用视觉风险检测和文本风险检测组合的多模态内容检测方式,提高了屏幕内容检测准确率。
技术关键词
屏幕内容图像 内容检测方法 风险 虚拟专用网络 文本 视觉 多模态 样本 内容检测系统 内容显示 语义 冻结器 对象识别 编码特征 注意力机制 进程 可读存储介质
系统为您推荐了相关专利信息
1
一种面向智能制造的大模型预训练方法及系统
预训练方法 模型预训练 冗余 语义 大语言模型
2
一种基于车联网的行车安全预警系统及方法
车辆周围环境数据 数字孪生模型 风险 深度神经网络模型 量子态
3
一种基于大语言模型的数据集关键词生成及筛选方法
关键词 大语言模型 筛选方法 文本 语义
4
一种基于人工智能的情绪分析方法及系统
情绪分析方法 面部特征点 文本情感分类模型 强度 标签
5
一种基于AI的重症患者脓毒症早期预警方法及系统
早期预警方法 器官功能障碍 动脉血压波形 早期预警系统 患者
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号