一种字幕及其显示图形实时生成系统

AITNT
正文
推荐专利
一种字幕及其显示图形实时生成系统
申请号:CN202410846016
申请日期:2024-06-27
公开号:CN118678008B
公开日期:2025-01-28
类型:发明专利
摘要
本发明公开了一种字幕及其显示图形实时生成系统,涉及字幕生成技术领域,包括音视频导入模块、音频提取模块、语音转换模块、角色识别模块、情感识别模块、字体图形模块、字幕显示控制模块、字幕图形控制模块;该字幕及其显示图形实时生成系统,通过设置音视频导入模块、音频提取模块、语音转换模块、角色识别模块、情感识别模块等,可识别出角色的情感,并使用设置的不同的字体和装饰图形,显示、装饰不同情感的字幕,使得观众可通过字幕了解角色的情感,更具趣味性;控制每个字幕的字数,基于时间间隔控制弹幕显示的位置,使得每个字幕信息不会过长,并保证了每个字幕信息的显示时间,保证观众来得及观看。
技术关键词
情感识别模型 音频 识别模块 生成系统 显示控制模块 面部特征 音视频 深度学习模型 识别码 语音识别算法 字体 标签 样式 端点检测算法 装饰 检测字幕 图像
系统为您推荐了相关专利信息
1
一种文档管理方法、装置及存储介质
文档管理方法 电子标签 读写设备 文件盒 电磁锁
2
驾驶员身份识别方法、装置、设备及介质
事件特征 频域特征 时序特征 方向盘转向角度 识别驾驶员身份
3
一种优化RRT算法的无人船路径规划系统及方法
路径规划系统 RRT算法 图像拍摄设备 全局路径规划 视觉
4
一种用于麦克风阵列会议设备的语音识别方法及装置
语音识别方法 麦克风阵列 会议设备 音频 语音唤醒模型
5
一种支持语音点播音乐的智能相册系统
智能相册系统 大语言模型 服务器 音乐 终端设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号