摘要
本申请属于人工智能技术领域,涉及一种基于人工智能的文本处理方法、装置、计算机设备及存储介质,包括:接收用户输入的包含多音字的原始文本序列;对原始文本序列进行调整处理得到目标文本序列;对目标文本序列进行语义特征提取得到语义特征;获取原始文本序列的数据规模,并判断数据规模是否大于预设规模;若是,调用目标数量的分类器,并基于各分类器分别对语义特征进行预测处理得到多个发音结果;对所有发音结果进行聚合得到目标发音结果;对目标发音结果进行输出。此外,本申请还涉及区块链技术,目标发音结果可存储于区块链中。本申请可应用于金融领域与医疗领域中的多音字处理场景,有效地提高了多音字发音识别的处理效率与处理准确率。
技术关键词
文本处理方法
分类器
发音
序列
语义特征提取
计算机可读指令
集成学习策略
规模
计算机设备
文本处理装置
BERT模型
可读存储介质
数据
人工智能技术
区块链技术
处理器
输出模块