摘要
本申请的面向网络反馈信息监测的短文本微博共指消解模型,根据短文本中出现的敏感主题词的衍生词的识别,设计了短文本实体消解模型架构、短文本微博共指消解流程,提出了提取关键词、短文本特征提取、基于搜索引擎的文本特征扩展、训练噪声稀疏自适应编码器、训练分类器等一系列方法,通过设计加入符合敏感信息及敏感主题词特征的命名实体和名词短语筛选及针对短文本的特征提取方法,然后联接噪声稀疏自适应编码器对敏感主题词共指消解,实现了面向网络反馈信息监测的短文本微博共指消解,在特征提取及特征向量算法方面,性能提升了11.8%,与浅层机器学习算法SVM对比,性能提升了16.2%,且在不同的数据集下,本申请模型稳定高效。
技术关键词
编码器
文本
特征模板
关键词
训练分类器
上下文特征
特征扩展方法
噪声
网络
名词短语识别方法
特征选择
梯度下降算法
CRF模型
关键字
实体共指消解
分词
vsm模型
条件随机场模型
系统为您推荐了相关专利信息
电气设备运行状态
设备信息管理系统
大语言模型
生成系统
填写系统
多模态线索
网络
专用编码器
多头注意力机制
阶段
文本生成方法
嵌入水印信息
文本生成模型
私钥
公钥