摘要
本申请公开了一种基于图像识别的文字生成方法,涉及图像识别技术领域,包括进行信息采集得到原始采集信息,原始采集信息包括原始图像信息和原始环境语音信息;对原始图像信息预处理得到图像预处理信息,对原始环境语音信息预处理得到环境语音预处理信息;根据预处理图像信息得到文字初步生成结果;根据图像预处理信息和环境语音预处理信息判断是否调整文字初步生成结果,若需调整则调整得到文字生成环境调整结果;判断图像采集时的场景与文字生成环境调整结果的场景是否匹配,并判断是否需调整,若需调整则对文字播放速度、图像播放速度调整直至场景匹配输出最终文字生成结果。本申请具有提高基于图像识别的文字生成准确性的效果。
技术关键词
文字生成方法
生成场景
生成文字
逻辑
语音切割技术
畸变矫正算法
图像降噪技术
图像增强技术
人声
速度
图像识别技术
大数据技术
高清摄像头
标记
复杂度
字体
系统为您推荐了相关专利信息
图像数据压缩
图像数据处理电路
格式化
预处理算法
配置图像传感器
意图识别
动态词库
自然语言
模块
多模态特征融合
电力设备智能
管理系统
动态预测模型
变分自动编码器
校正模块