摘要
本说明书提供一种基于大语言模型的皮肤检测方法及装置,所述方法包括:获取对待检测的皮肤区域进行拍摄得到的至少一幅图像,并将所述至少一幅图像输入多模态模型,由所述多模态模型基于所述至少一幅图像,生成与所述皮肤区域对应的第一描述文本;获取用于描述所述皮肤区域的音频,并对所述音频进行语音识别,以将所述音频转换为与所述皮肤区域对应的第二描述文本;基于所述第一描述文本和所述第二描述文本,构建提示文本,并将所述提示文本输入大语言模型,由所述大语言模型在所述提示文本的引导下,生成与所述皮肤区域对应的皮肤检测结果文本。
技术关键词
大语言模型
文本
皮肤检测方法
音频
多模态
语音识别模型
答案
图像
皮肤检测装置
语音识别模块
处理器
多轮对话
指令
计算机程序产品
可读存储介质
视频帧
电子设备
系统为您推荐了相关专利信息
多模态深度学习
文字主体
自然语言模型
文字区域图像
生成文字
关键词
发光二极管闪烁
骨传导传感器
运动传感器数据
音频
声学传递函数
声学特征分析
双耳音频信号
时域特征
多头注意力机制
微调方法
视觉特征
文本分类器
文本编码器
多模态
智能路灯管理系统
人工智能监控
自然语言
路灯控制器
控制模块