摘要
本发明实施例公开一种语音转写热词自动提取方法、装置、电子设备及存储介质,该方法包括:基于目标音频文件的标准文本计算相应转写文本的字准确率,并基于字准确率判断标准文本是否为热词提取对象,相应转写文本为语音转写模型转写目标音频文件得到的文本;在标准文本为热词提取对象时,获取标准文本和相应转写文本的分词处理结果对应得到多个标准分词和多个转写分词;获取各个标准分词中与相应转写分词存在差异且不在转写文本中的标准分词得到备选热词;以及基于备选热词确定语音转写模型的热词文件。本发明实施例能够降低提取热词所需的成本,并提高热词提取效率。
技术关键词
热词自动提取方法
分词
文本
语音
对象
电子设备
处理器
可读存储介质
模块
存储器
策略
程序
计算机
算法
动态
系统为您推荐了相关专利信息
对话生成模型
心理测评方法
文本
生成训练样本
注意力机制
检验检测服务
语句
语义分析模型
数据库系统
数据获取模块