一种基于算法模型的演讲文稿生成方法及系统

正文

推荐专利

申请号：CN202411095050

申请日期：2024-08-12

公开号：CN118657121B

公开日期：2024-10-22

类型：发明专利

摘要

本发明提供了一种基于算法模型的演讲文稿生成方法及系统，包括：获取训练时的第一演讲音视频文件，并对第一演讲音视频文件解析，第一图像结果和音频结果；除去第一图像结果的背景，并对得到待检测第一图像结果进行分类，得到文字区、表格区和图片区；根据初始的第一增强权重对分类结果进行增强，得到增强特征，并获取对应的扩写文本，将扩写文本作为第一孪生网络模型输入；对音频结果进行识别，得到演讲人的演讲文本，并将演讲文本作为第一孪生网络模型的第二个输入进行训练，得到训练好的第二扩写网络模型后对测试时的演讲素材，生成演讲文稿；采用本发明能够提高扩写文本有侧重的生成质量。

技术关键词

意图算法模型文字特征音视频语音识别网络图片生成方法灰度直方图标签文本表格特征掩膜语音识别单元图像识别模型音频解析单元光学字符识别

系统为您推荐了相关专利信息

抽水蓄能电站云管边端协同视频监控系统及方法

抽水蓄能电站视频监控方法视频流服务器节点

人机对话处理方法、装置、设备及介质

语音阶段图谱标签网络结构

一种100W视频喂食器

音频功率放大器喂食器电量检测电路补光电路电阻

基于深度强化学习的改善飞机电推进系统外散热的方法

电推进系统飞机整流罩散热结构进气口深度强化学习方法

一种辅助酒店入住的客服管理方法及设备

客服管理方法关键字平台移动设备数据聚类算法

一种基于算法模型的演讲文稿生成方法及系统

站点导航

APP 下载