医疗多语言场景的语音识别方法、系统、设备及介质

AITNT
正文
推荐专利
医疗多语言场景的语音识别方法、系统、设备及介质
申请号:CN202511038448
申请日期:2025-07-25
公开号:CN121034287A
公开日期:2025-11-28
类型:发明专利
摘要
本申请涉及人工智能技术领域,揭示了一种医疗多语言场景的语音识别方法、系统、设备及介质,其中方法包括:通过预设拾音设备采集医生和患者的综合语音数据;对所述综合语音数据进行人声分离处理,以得到医生语音数据和患者语音数据;基于所述医生语音数据和所述患者语音数据获取多语言识别模型;通过所述多语言识别模型对所述医生语音数据和所述患者语音数据进行识别,得到医生文本内容和患者文本内容;将所述医生文本内容以及所述患者文本内容保存至所述患者在预设医疗系统的目录下。本发明的有益技术效果:显著优化了医疗信息记录过程,提升了医生的工作效率和患者的就医体验,同时较大程度上减轻了信息缺失带来的医疗风险。
技术关键词
多语言 语音识别方法 术语 患者 文本 数据 医疗系统 拾音设备 识别神经网络 人声 场景 扫描模块 语音活动检测 语音识别系统 目录 处理器 人工智能技术 识别模块 可读存储介质
系统为您推荐了相关专利信息
1
数据集构建方法、信息检索方法及装置
语义关联度 数据集构建方法 信息检索方法 样本 信息检索装置
2
一种基于大模型知识增强的工业设备使用寿命预测方法
序列 大语言模型 文本 数据 表达式
3
搜索结果确定方法、装置、电子设备和存储介质
语义特征 文本 标识 特征提取网络 样本
4
一种基于RAG的代码评审方法
代码评审方法 代码评审系统 代码评审技术 分层策略 评审工作
5
基于视觉令牌剪枝的多模态大模型无训练推理加速方法和装置
令牌 视觉 多层注意力 序列 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号