摘要
本发明实施例提供一种基于多模态人工智能的人才画像构建方法、装置、设备以及介质。该方法包括:采集用户在基本问题下的第一音频,以及采集用户在目标问题下的第二音频和相关视频;对第一音频进行语音分析获得初始语音特征,并对第二音频进行语音识别获得初始文本信息;根据初始语音特征和初始文本信息进行语音生成获得第三音频;根据第二音频和第三音频结合相关视频确定第一可靠度;对相关视频进行关键帧识别获得目标动作,并根据目标动作确定第二可靠度;根据目标问题和初始文本信息确定初始技能分值;根据第一可靠度和第二可靠度结合初始技能分值确定目标技能分值;根据目标技能分值结合目标问题确定用户对应的目标人才画像。
技术关键词
人才画像
音频
文本
视频帧
距离信息
数据
语音特征
多模态
初始聚类中心
关键帧
骨骼特征
分析模块
计算机存储介质
序列
动作识别模型
矩阵
终端设备
系统为您推荐了相关专利信息
报告生成方法
意图识别
多智能体协作
数据可视化
生成智能
RGB特征
光流特征
动作定位方法
音频特征
状态空间模型
智能生成系统
微服务架构
服务器
构建知识图谱
存储算法