摘要
本发明涉及数据处理技术领域,公开了基于多模态的信息匹配方法、装置、计算机设备及介质,该方法包括:获取目标场景内不同任务对象的待提取影音文件;采用物体检测技术、声纹识别技术和自然语言处理技术对影音文件进行多模态处理,并从多模态处理后的影音文件中提取不同任务对象对应的多维度特征集;基于不同任务对象对应的多维度特征集构建人物画像;基于预先记录的时间戳采用特征比对算法将人物画像匹配至既定人员,本发明省去大量的人力物力的同时,可以动态分析画像信息,确保其时效性与准确性。可以从大量的非结构化对话文本中自动提取信息,涵盖更多的交互场景和细节,避免了传统方法数据获取与分析过程中由于主观因素导致的误差。
技术关键词
物体检测技术
信息匹配方法
声纹识别技术
多模态
画像
身份
对象
动作特征
反馈特征
自然语言
大语言模型
语音识别技术
计算机设备
信息匹配装置
时间段
音频
文本
场景
算法
系统为您推荐了相关专利信息
优化调控方法
调度优化模型
柔性负荷资源
排放流
发电机组
物联网架构
故障预测模型
固件更新
分布式数据管理
动态
多模态数据采集
声学特征
多模态深度学习
子模块
高维特征向量
半球谐振陀螺
优化控制方法
双闭环控制策略
卡尔曼滤波器
优化控制策略
文本
语音指令控制方法
服务器
计算机设备
计算机程序产品