医疗多语言场景的语音识别方法、系统、设备及介质

正文

推荐专利

申请号：CN202511038448

申请日期：2025-07-25

公开号：CN121034287A

公开日期：2025-11-28

类型：发明专利

摘要

本申请涉及人工智能技术领域，揭示了一种医疗多语言场景的语音识别方法、系统、设备及介质，其中方法包括：通过预设拾音设备采集医生和患者的综合语音数据；对所述综合语音数据进行人声分离处理，以得到医生语音数据和患者语音数据；基于所述医生语音数据和所述患者语音数据获取多语言识别模型；通过所述多语言识别模型对所述医生语音数据和所述患者语音数据进行识别，得到医生文本内容和患者文本内容；将所述医生文本内容以及所述患者文本内容保存至所述患者在预设医疗系统的目录下。本发明的有益技术效果：显著优化了医疗信息记录过程，提升了医生的工作效率和患者的就医体验，同时较大程度上减轻了信息缺失带来的医疗风险。

技术关键词

多语言语音识别方法术语患者文本数据医疗系统拾音设备识别神经网络人声场景扫描模块语音活动检测语音识别系统目录处理器人工智能技术识别模块可读存储介质

系统为您推荐了相关专利信息

数据集构建方法、信息检索方法及装置

语义关联度数据集构建方法信息检索方法样本信息检索装置

一种基于大模型知识增强的工业设备使用寿命预测方法

序列大语言模型文本数据表达式

搜索结果确定方法、装置、电子设备和存储介质

语义特征文本标识特征提取网络样本

一种基于RAG的代码评审方法

代码评审方法代码评审系统代码评审技术分层策略评审工作

基于视觉令牌剪枝的多模态大模型无训练推理加速方法和装置

令牌视觉多层注意力序列多模态

医疗多语言场景的语音识别方法、系统、设备及介质

站点导航

APP 下载