摘要
本发明适用于医疗信息处理技术领域,提供了一种基于改进的TextCNN的患者意图分类方法,包括以下步骤:对患者对话文本进行文本预处理,得到token列表;利用预训练的word2vec模型将每个token列表转换为词向量,生成词嵌入矩阵;构建改进的TextCNN模型并使用带有意图标注的语料数据对其进行训练,对文本向量进行分类;通过正则表达式匹配固定句式和关键词,对分类结果进行校正。本发明通过预处理步骤,减少了文本中的噪音,提升了模型的训练效果;使用word2vec模型和改进的TextCNN网络,能够更加有效地捕捉文本的语义信息,提高分类的准确性;通过正则表达式匹配校正步骤,提升了分类结果的可靠性。
技术关键词
意图分类方法
word2vec模型
文本
医疗信息处理技术
患者
注意力机制
关键词
矩阵
特征描述符
医疗场景
静态方式
列表
多层感知机
校正
通道
优化器
数据
参数