摘要
本发明提供了一种基于融合架构的端侧RAG实现方法及系统,方法包括通过用户浏览器对向量化引擎进行初始化,以得到初始化向量模型;基于初始化向量模型对本地文本知识库进行向量化处理,以得到向量知识库;获取用户下发的查询文本,基于查询文本与向量知识库进行检索查询,以输出检索结果;基于当前网络环境对全周期工作量进行智能决策,以实现动态计算卸载;对全周期数据进行加密、存储与验证,以完成端侧RAG的实现,本发明替代传统云端向量计算架构,通过纯前端计算架构实现AI工作流的零服务端成本运行,解决中心化AI平台算力贵、延迟高、隐私差三大痛点。
技术关键词
文本
工作量
周期
降级策略
生成向量
参数获取设备
生成加密密钥
加密数据
动态
位置指针
决策
适配器
处理器
网络
加密算法
云端
模块
系统为您推荐了相关专利信息
协同注意力
生成数据库
跨模态
损失函数优化
多模态数据融合
智能诊断方法
自然语言
中医智能诊断系统
对话策略
图谱
密钥管理系统
节点
负载均衡方法
负载均衡策略
周期