摘要
本发明公开基于NLP实现热词提取规范自动转写的方法,通过预设不同的场景,定义场景中的热词类型并构建常用热词库,对文档进行预处理、清洗;自动分析清洗完成的上下文数据,自动提取对应的文件内容中的热词;对提取的热词进行智能分类、构建动态热词库;同时语音转写结果实时转入热词校验模块;并根据上述语音识别结果上下文进行语义分析,判断最符合的热词,并将提取的热词结果进行替换展示;展示热词替换的规范化结果,自动调整语音识别的文字结果,实时更新动态热词库中的热词权重,基于训练好的NLP语义模型,运用聚类算法、主题分析等技术,从预处理后的文本中提取出具有代表性的热词,提高转写的准确度。
技术关键词
校验模块
语义
语音识别引擎
文本
实时语音
场景
动态
聚类算法
分段
机制
定义
缓冲
词语
数据
主题
字段
日期
格式
系统为您推荐了相关专利信息
轨迹预测方法
车辆运动学
阶段
辅助编码器
车辆轨迹预测技术
文本特征向量
图像特征向量
多模态
三元组损失函数
视觉
数据资源授权方法
业务系统
软件开发包
权限技术
语义
自然语言
调优方法
原始诊断数据
个性化推荐算法
注意力机制