一种利用智能眼镜语音辅助盲人日常生活的方法

AITNT
正文
推荐专利
一种利用智能眼镜语音辅助盲人日常生活的方法
申请号:CN202410871084
申请日期:2024-07-01
公开号:CN118781361A
公开日期:2024-10-15
类型:发明专利
摘要
本发明属于人工智能技术领域,具体涉及一种利用智能眼镜语音辅助盲人日常生活的方法,包括有以下步骤:步骤S100:图像特征提取;步骤S200:文本特征提取;步骤S300:多模态特征融合;步骤S400:文本生成;步骤S500:文本转语音:将所得到的文本序列通过语音输出;本发明的技术方案,能够在智能眼镜采集周围环境图像后,通过语音播报的方式,提示盲人具体方位下的环境、物体信息,可应用于包括物体识别、路径指引、交通信号识别、商品信息获取等方面,通过这些功能,失明人群可以更自主地进行日常活动,不仅能够显著提升失明人群的生活质量,还能够促进他们更好地融入社会,增强他们的自信心和独立性。
技术关键词
图像特征向量 文本特征向量 辅助盲人 智能眼镜 训练特征提取模型 语音 日常生活 BERT模型 多模态特征融合 序列 图像特征提取 注意力机制 解码器 采集周围环境 全局平均池化 韵律预测
系统为您推荐了相关专利信息
1
一种基于AR智能眼镜的故障处理辅助方法及系统
AR智能眼镜 风险 实时数据 SLAM技术 机器学习模型
2
聚类结果的解释文本生成方法、装置、设备及存储介质
文本特征向量 文本生成方法 聚类 大语言模型 文本生成装置
3
一种基于多模态数据的数据中心建筑信息模型(BIM)动态耦合生成方法
像素点 残差模块 解码器 建筑信息模型 图像特征编码
4
文生图模型、模型训练、图像生成方法、装置及电子设备
文本特征向量 文本编码器 图像特征向量 绘画 风格
5
一种基于多模态大模型的国际传播受众反馈讽刺检测方法
图片 相似性度量函数 文本特征向量 多模态 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号