摘要
本发明提供了一种基于算法模型的演讲文稿生成方法及系统,包括:获取训练时的第一演讲音视频文件,并对第一演讲音视频文件解析,第一图像结果和音频结果;除去第一图像结果的背景,并对得到待检测第一图像结果进行分类,得到文字区、表格区和图片区;根据初始的第一增强权重对分类结果进行增强,得到增强特征,并获取对应的扩写文本,将扩写文本作为第一孪生网络模型输入;对音频结果进行识别,得到演讲人的演讲文本,并将演讲文本作为第一孪生网络模型的第二个输入进行训练,得到训练好的第二扩写网络模型后对测试时的演讲素材,生成演讲文稿;采用本发明能够提高扩写文本有侧重的生成质量。
技术关键词
意图
算法模型
文字特征
音视频
语音识别网络
图片
生成方法
灰度直方图
标签
文本
表格特征
掩膜
语音识别单元
图像识别模型
音频
解析单元
光学字符识别
系统为您推荐了相关专利信息
音频功率放大器
喂食器
电量检测电路
补光电路
电阻
电推进系统
飞机整流罩
散热结构
进气口
深度强化学习方法
客服管理方法
关键字
平台
移动设备
数据聚类算法