摘要
本发明公开一种基于问答机制的文本变体词识别方法、装置及设备,属于文本信息识别领域。所述方法包括:构建变体词库,并通过汉字的字形和拼音的分别编码对所述变体词库进行数据增强;在数据增强后的变体词库上训练一变体词推理模型,所述变体词推理模型的网络结构包括:一语言表征模型和两个独立的全连接层;将问答模板与文本内容相连接后输入所述变体词推理模型,得到文本内容中变体词的起始位置概率和结束位置概率;基于变体词的起始位置概率和结束位置概率确定变体词的确切边界,得到文本内容中变体词的识别结果。本发明不仅能够提高变体词识别的准确性,还能够有效地降低模型的维护成本,增强其在实际应用中的适应性和鲁棒性。
技术关键词
变体词识别方法
问答模板
文本
计算机程序指令
汉明距离
拼音
网络结构
BERT模型
机制
生成汉字
编码
可读存储介质
数据
电子设备
多标签
识别装置
处理器
模块
鲁棒性
系统为您推荐了相关专利信息
织物
参数生成方法
参数生成装置
子系统
触觉特征
人交互方法
执行用户意图
生成数字人
语义标签
文本