摘要
本发明公开了一种基于LLM的历史记录回溯方法,涉及数据检索和自然语言处理领域,本发明的方法包括:在本地计算机中收集用户各类操作数据,再结合OCR技术和ASR技术,提取图片和语音中的文本信息,与相关信息统一格式存储到数据库中;对采集到的多模态数据信息进行处理,首先会对收集的数据进行去重和清洗,再将收集到的截图转换为视频,最后对视频图像帧、OCR结果和语音转录文本进行嵌入向量并存入向量数据库;采用微调技术对预训练的LLM进行特定方向的优化;实现与历史时间线的对话,首先捕获用户输入并存入查询队列,再通过与LLM交互、结合记忆模块和RAG技术生成个性化响应,并展示回答与相关图像或音频链接。
技术关键词
回溯方法
文本
答案
加载器
视频
图像
微调器
自动语音识别
记忆
聊天机器人
微调技术
数据存储
计算机屏幕
生成高度
预训练模型
音频
图片
标识符
系统为您推荐了相关专利信息
多模态
语音情感识别技术
访问权限分级
生物
加密认证算法
掩膜
大气散射模型
场景
环境光
轻量级卷积神经网络
样本
主编码器
BERT模型
社交媒体平台
掩码策略