基于变体词识别的直播违规行为检测方法、装置及设备

正文

推荐专利

申请号：CN202410979366

申请日期：2024-07-22

公开号：CN118967153B

公开日期：2025-08-19

类型：发明专利

摘要

本发明提出了一种基于变体词识别的直播违规行为检测方法，包括：基于语音识别模型和光学字符识别模型，获取直播间的音频和视觉文字，并转化为文本数据；提取文本数据，并进行多层级变体词识别，包括：基于正则匹配的变体词识别、基于统计语言模型的变体词识别和基于大语言模型的变体词识别；基于识别到的变体词，获取变体词的原词，并将原词与敏感词库进行匹配，判断原词是否存在；如果原词存在，则调取变体词前后设定时长的视频数据，并保存为违规证据。本申请采取不同的识别检测方法来应对不同类型的变体词，在不同时间粒度采用不同精细度的变体词识别方法，实现了直播违规行为检测技术中实时性与准确性的平衡。

技术关键词

统计语言模型大语言模型语音识别模型光学字符识别层级变体词识别方法音形文本语义识别检测方法数据视觉可读存储介质识别结构处理器视频音频发音电子设备听觉

系统为您推荐了相关专利信息

一种基于人工智能的海洋生态环境评估方法及系统

海洋生态环境海洋环境数据编码评估系统身份

一种分析文旅景点喜好的文旅内容推荐系统

内容推荐系统光学字符识别兴趣画像模型训练模块时间序列分析方法

一种特征融合与行锚点分类驱动的快速车道线检测方法

车道线检测方法融合特征分类网络多尺度特征融合层级

基于大语言模型的医学影像报告生成方法及系统

大语言模型报告生成方法影像文本列表

一种基于大语言模型的SRAF图形生成方法及系统

图形生成方法大语言模型布局图案对齐模块图形生成系统

基于变体词识别的直播违规行为检测方法、装置及设备

站点导航

APP 下载