摘要
本发明公开了一种基于大模型的财税问答敏感信息识别方法及系统,其中方法包括:获取财税提问数据,并对获取的所述财税提问数据进行处理;对经过处理的所述财税提问数据,通过建立的汉语拼音敏感词Trie树进行关键违禁词检测;当判断出所述财税提问数据不存在关键违禁词时,通过经过训练的财税大模型中的违规语义对违规敏感词进行检测;当所述财税大模型的输出中未检测出违规敏感词时,将所述财税提问数据输出至正常问答系统。本发明通过训练得到的财税大模型对财税违规导向问答进行筛查,本发明构造了汉语拼音敏感词Trie树以及通过训练大模型的语义理解能力提升检测效果,实现敏感文本的识别。
技术关键词
敏感信息识别方法
数据
问答系统
信息识别系统
语义
标签
节点
模板
文本
简体
拼音
标记
字符
符号
终端
参数
系统为您推荐了相关专利信息
容量优化配置方法
相机
新能源场站
模拟退火遗传算法
节点
系数计算方法
计算器
测井解释模型
插值方法
储层物性参数