摘要
本申请涉及一种基于指定主题场景下智能内容过滤的方法,实现在指定主题场景下对ASR输出文本进行无关内容的精确过滤。所述方法包括:对零样本分类模型进行优化,得到优化的零样本分类模型;采用优化的零样本分类模型对第一ASR输出文本进行主题分类,得到第一无关内容文本;构建动态词库,计算所述第一ASR输出文本与所述动态词库的相关性,根据相关性筛选得到第二无关内容文本;对所述第一无关内容文本和所述第二无关内容文本进行比对重复内容,得到第三无关内容文本;在所述第一ASR输出文本中剔除所述第三无关内容文本,得到过滤后的第一ASR输出文本。
技术关键词
动态词库
关键词
文本
主题
样本
语句
场景
说话人身份
标签
图谱
语义
模板
度函数
超参数
连续性
算法
表达式
词典
核心
编码
系统为您推荐了相关专利信息
训练检测模型
游泳场馆
匈牙利算法
动态滑动窗口
多策略融合
智能教育教学
切片
评价方法
上下文特征
数据采集平台
文本编码器
文本检测方法
大语言模型
检测器
对齐模块
知识图谱数据库
查询意图
答案
文本
智能问答方法
文本
基准转换方法
数字地表模型
多项式
数字高程模型