摘要
本发明涉及人工智能和自然语言处理领域,尤其涉及一种基于深度学习的长文本语义分类方法。内容包括:对原始文本进行结构化清洗与句子边界识别,得到句子序列;基于句子序列,构建语义片段;对语义片段进行编码处理,生成段级语义向量序列;基于段级语义向量序列,通过语义张力驱动聚合算法,生成全局语义表示向量;基于全局语义表示向量,设计语义流动增强分类器,完成文本分类。解决了传统的文本分类方法在处理长文本时容易出现语义不连贯和上下文信息丢失,尤其在文本存在结构性语义突变时,传统模型往往无法准确捕捉这些突变带来的语义变化;传统分类器往往容易对多数类样本过度拟合,而忽略少数类的识别的问题。
技术关键词
语义分类方法
语义向量
分类器
序列
节点
文本分类方法
训练语言模型
自然语言
标记
标识
传播算法
滑动窗口
编码
分词
批量
策略
样本
系统为您推荐了相关专利信息
室内环境温度调节
序列
数据
可靠性参数
温度传感器
集成故障
综合电源
故障预测模型
融合特征
测试方法