摘要
本发明属于语言处理与识别技术领域,具体涉及一种机器人报修场景的手机号抽取方法,包括以下步骤:S1、接收ASR识别出的文本,接收自动语音识别(ASR)技术识别出的客户说话文本;S2、话术转换,将文本内容中的数字话术转换为对应的数字;S3、抽取并挖空,在一轮会话中抽取可能完整的手机号,并将抽取后的原始多轮文本组合后进行挖空;S4、全量数字提取,对剩余文本进行全量数字提取;S5、正则收取,使用正则表达式从数字文本中提取多个手机号并进行格式正确性校验。本发明能够通过话术的转换与抽取方法,去除用于语音中的无关信息,并自动转换非标准数字表达话术至标准数字序列,准确的识别和提取手机号码。
技术关键词
机器人
自动语音识别
场景
非标准
文本分析技术
序列
格式化
客户
模式
字符