摘要
本申请公开了一种基于概率分布的文本匹配方法、装置、设备及存储介质,涉及自然语言处理技术领域,该方法包括:从专业知识库中获取各个专业知识文本的语义特征分布,得到知识概率分布集合,通过概率分布抽象化文本内在特征,实现了知识库的规范化表示。获取用户输入文本,计算对应的用户文本概率分布,显著提高了文本匹配的容错性。通过计算用户文本概率分布与知识概率分布集合中各分布的相似性距离,通过分布距离度量整体语义相似性而非局部匹配,使比较过程能容忍分布偏移。最后根据相似性距离的最小值确定文本匹配结果,实现了在高噪声下稳定检索语义相关专业知识的效果,显著提升容错性和匹配精度。
技术关键词
专业知识库
文本匹配方法
语义特征
文本匹配装置
匹配设备
自然语言
处理器
可读存储介质
模块
关系
存储器
度量
计算机
噪声
定义
频率
精度
系统为您推荐了相关专利信息
立体定向
特征提取模块
语义特征
图像特征提取
解码网络
智能推荐方法
编码向量
语义特征提取
序列
数据嵌入