摘要
本发明公开了一种基于个性化词库的语音转文字系统及方法,其中方法包括:收集当前用户的个人数据和语音数据;利用多带线性预测编码方法对语音数据进行特征提取,得到特征向量组;将特征向量组输入语音转文字大模型,得到第一文本;根据个人数据从专业数据库中进行筛选,得到第一词库;根据个人数据得到相关用户的共享词库,得到第二词库;将第一词库与第二词库合并,得到当前用户的个性化词库;根据个性化词库对第一文本进行自动修改后,再进行人工修改,得到人工修改词汇和最终文本;根据人工修改词汇对当前用户的个性化词库进行更新。本发明涉及语音梳理技术领域,解决了现有系统中语音特征识别准确性低、语音转文字精确度不足的技术问题。
技术关键词
预测编码方法
文本
专业数据库
深度学习算法
语音转文字方法
构建语音识别模型
频谱特征
线性
分词
融合特征
梳理技术
语音识别模块
数字滤波器
索引
频率
特征提取模块