基于多模态大模型的屏幕内容检测方法、系统及存储介质

正文

推荐专利

申请号：CN202510904852

申请日期：2025-07-01

公开号：CN120751179A

公开日期：2025-10-03

类型：发明专利

摘要

本发明提供了一种基于多模态大模型的屏幕内容检测方法、系统及存储介质，该方法包括：屏幕内容图像进行图像预处理，得到待检测图像和待检测文本；将待检测图像输入预训练后的视觉检测大模型进行视觉风险检测，得到视觉风险值，将待检测文本输入预训练后的文本检测大模型进行文本风险检测，得到文本风险值；根据屏幕内容图像的图像类型对视觉风险值和文本风险值进行加权运算，得到目标风险值；若目标风险值大于第一风险阈值，控制目标屏幕开启虚拟专用网络，根据虚拟专用网络控制目标屏幕进行预设内容显示。本发明实施例，通过采用视觉风险检测和文本风险检测组合的多模态内容检测方式，提高了屏幕内容检测准确率。

技术关键词

屏幕内容图像内容检测方法风险虚拟专用网络文本视觉多模态样本内容检测系统内容显示语义冻结器对象识别编码特征注意力机制进程可读存储介质

系统为您推荐了相关专利信息

一种面向智能制造的大模型预训练方法及系统

预训练方法模型预训练冗余语义大语言模型

一种基于车联网的行车安全预警系统及方法

车辆周围环境数据数字孪生模型风险深度神经网络模型量子态

一种基于大语言模型的数据集关键词生成及筛选方法

关键词大语言模型筛选方法文本语义

一种基于人工智能的情绪分析方法及系统

情绪分析方法面部特征点文本情感分类模型强度标签

一种基于AI的重症患者脓毒症早期预警方法及系统

早期预警方法器官功能障碍动脉血压波形早期预警系统患者

基于多模态大模型的屏幕内容检测方法、系统及存储介质

站点导航

APP 下载