一种基于图像识别的文字生成方法

正文

推荐专利

一种基于图像识别的文字生成方法

申请号：CN202510749883

申请日期：2025-06-06

公开号：CN120612461A

公开日期：2025-09-09

类型：发明专利

摘要

本申请公开了一种基于图像识别的文字生成方法，涉及图像识别技术领域，包括进行信息采集得到原始采集信息，原始采集信息包括原始图像信息和原始环境语音信息；对原始图像信息预处理得到图像预处理信息，对原始环境语音信息预处理得到环境语音预处理信息；根据预处理图像信息得到文字初步生成结果；根据图像预处理信息和环境语音预处理信息判断是否调整文字初步生成结果，若需调整则调整得到文字生成环境调整结果；判断图像采集时的场景与文字生成环境调整结果的场景是否匹配，并判断是否需调整，若需调整则对文字播放速度、图像播放速度调整直至场景匹配输出最终文字生成结果。本申请具有提高基于图像识别的文字生成准确性的效果。

技术关键词

文字生成方法生成场景生成文字逻辑语音切割技术畸变矫正算法图像降噪技术图像增强技术人声速度图像识别技术大数据技术高清摄像头标记复杂度字体

系统为您推荐了相关专利信息

一种适用于多片TDICMOS图像传感器的数据处理与压缩系统

图像数据压缩图像数据处理电路格式化预处理算法配置图像传感器

一种多模态敏感词精准筛查、审核和意图识别的智能体

意图识别动态词库自然语言模块多模态特征融合

基于AI的自动化企业财经分析系统和方法

财务企业指标分析系统子模块

一种电缆护套换模控制方法及系统

挤出设备参数电缆护套权重分配策略偏差

基于AI Agent的电力设备智能预警与维护管理系统

电力设备智能管理系统动态预测模型变分自动编码器校正模块

一种基于图像识别的文字生成方法

站点导航

APP 下载