摘要
本发明提供一种数据清洗转录方法、装置、电子设备及存储介质,涉及数据处理技术领域,包括:在接收到文档格式的待清洗文件的情况下,将所述待清洗文件进行格式清洗,得到格式清洗后的第一待清洗文件;其中,所述格式清洗包括:清洗所述待清洗文件的元数据和扩展属性数据;根据预设大纲模板和章节模板,对所述第一待清洗文件进行大纲及章节清洗,得到清洗后的第二待清洗文件;将所述第二待清洗文件进行文本内容清洗,得到文档格式的清洗后文件。
技术关键词
转录方法
格式
光学字符识别
模板
非暂态计算机可读存储介质
虚拟显示技术
自动语音识别
转录装置
文本
离散余弦变换
电子设备
数据处理技术
逻辑
像素矩阵
标签
处理器
音频
存储器
系统为您推荐了相关专利信息
大语言模型
题目生成方法
训练题目
计算机程序指令
参数
智能车辆环境感知
风险预测模型
多模态
预警方法
生成模板