摘要
本申请提供一种文字纠正方法、装置及电子设备,该方法包括:获取待处理文字,待处理文字是由实时采集的语音数据转换获得的;使用训练后的名字识别模型从待处理文字中抽取出待处理名词;查找与待处理名词的语义相似度大于语义相似阈值的目标名字;判断目标名字与待处理名词之间的音形相似度是否大于音形相似阈值;若是,则将待处理文字中的待处理名词纠正为目标名字。在上述方案的实现过程中,通过结合语义相似度与音形相似度的双重验证机制,其中的语义相似度确保候选词语符合上下文逻辑,音形相似度确保其发音或字形接近原词,二者结合避免了单一标准可能导致的过度纠错和遗漏纠正的问题,从而显著提升了语音转文字的准确率。
技术关键词
音形
汉字
字符
语义
纠正方法
机器可读指令
纠正装置
双重验证机制
拼音
语音
电子设备
模块
样本
处理器
编辑
数据
存储器
发音
纠错
词语