一种基于音频大模型的远程会议人声识别过滤方法及系统

AITNT
正文
推荐专利
一种基于音频大模型的远程会议人声识别过滤方法及系统
申请号:CN202411383827
申请日期:2024-09-30
公开号:CN119091897A
公开日期:2024-12-06
类型:发明专利
摘要
本发明涉及一种基于音频大模型的远程会议人声识别过滤方法,所述方法包括:预录入用户声音样本,对声音样本处理;从处理后的声音数据中提取声学特征,与预录入声音样本对应组成声音数据集;利用声音数据集训练音频大模型;在实时会议中,利用音频大模型接收并处理用户的实时声音;将处理后的声音输出至远程会议中;收集反馈信息,对声音识别模型进行迭代优化。与现有技术相比,本发明通过使用音频大模型进行深度学习,为音频采集与传输提供了更高的识别精度,减少了误识别的情况,同时音频大模型具备持续学习的能力,具有自适应能力与长期稳定性。
技术关键词
人声识别 过滤方法 会议 音频 声学特征 样本 过滤系统 数据 模型训练模块 实时通信 模型更新 识别模块 可读存储介质 电子设备 程序 加密 协议 计算机 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号