摘要
本发明公开了一种文本处理方法、装置、设备、介质和程序产品。本发明涉及大数据技术领域。该方法包括:获取待处理文本,并对待处理文本进行分类,得到待处理文本的文本类型;根据文本类型对待处理文本进行金额文本提取,得到待处理文本的至少一个金额文本;针对至少一个金额文本的各金额文本,基于预先设定的规范检测规则对当前金额文本进行规范检测,得到当前金额文本的规范检测结果;若当前金额文本为规范文本,根据预先建立好的树形金额词典对当前金额文本的文本字符串进行字符串分割,得到文本字符串对应的各分词串,并基于各分词串得到当前金额文本对应的金额数字。本发明的方法可以提高确定金额数字的效率、准确性以及灵活性。
技术关键词
文本处理方法
节点
分支
序列
文本处理装置
词典
语义
处理器
大数据技术
计算机程序产品
字符识别
分词
数值
模块
可读存储介质
简体
关键词
系统为您推荐了相关专利信息
声音检测方法
声音检测系统
通知
TLS协议
加密数据
卷积模块
表面缺陷检测系统
表面缺陷检测方法
图像多尺度
Softmax函数