摘要
本发明涉及自然语言处理技术领域,具体涉及一种多模态违禁词检测方法及系统,该方法包括:提取广告视频中的图像、语音以及文本数据,获取违禁词库中的各违禁词,获取文本数据的分词结果集合,构建违禁词库中各违禁词的各字符的多维字符‑词频向量,获取违禁词库中各违禁词内各字符的新的词汇的积极性判断函数、消极性判断函数,确定违禁词库中各违禁词的各字符的积极性指数、消极性指数,得到违禁词库中各违禁词的各字符的字符再确认特征指数,获取违禁词库中各违禁词在文本数据中的非违禁判定因数,结合神经网络模型完成广告视频中的多模态违禁词检测。本发明旨在提高违禁词检测的精度。
技术关键词
字符
词检测方法
神经网络模型
指数
文本
多模态
数据
分词
因子
情感特征
频率
聚类算法
自然语言
处理器
度量
广告
语音
存储器
视频
系统为您推荐了相关专利信息
语音风格迁移方法
神经网络模型
语音特征
编码器
解耦机制
外语口语测试方法
语音
交互注意力
发音
句式结构
社交媒体数据挖掘
时序特征
意图识别模型
语义向量
异常数据
任务调度方法
性能预测模型
指数
健康服务平台
时间段