摘要
本申请公开了一种专业术语的提取方法,装置及介质,该方法包括:从指定领域的语料文档中提取候选术语;确定各候选术语的专业性影响指标;专业性影响指标包括显著性指标、专业置信度和重要性指标中的至少两项;根据专业性影响指标,确定各候选术语的专业性评分;筛选出专业性评分大于评分阈值的目标术语;并基于目标术语,构建指定领域的专业术语库。由此,基于指定领域的语料文档提取候选术语,为不同领域构建专业术语库提供高效、准确的自动化提取方式。通过融合多项专业性影响指标,对候选术语进行专业性评分,从而准确地筛选出符合领域要求的专业术语,以便构建指定领域的高质量专业词汇库,为语音识别系统等应用场景提供数据支持。
技术关键词
术语
指标
专业
狄利克雷分布模型
命名实体识别方法
语音识别系统
分词
文本
处理器
可读存储介质
模块
存储器
程序
主题
计算机
场景
算法
频率