AI资讯新闻榜单内容搜索-部署

搜索
AI-TNT
搜索: 部署

树莓派上部署RAG!微软Phi-3技术报告揭示「小而美」模型如何诞生

树莓派上部署RAG!微软Phi-3技术报告揭示「小而美」模型如何诞生
9677 AI技术研报
树莓派上部署RAG!微软Phi-3技术报告揭示「小而美」模型如何诞生

万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化
9200 AI技术研报
万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

手机流畅运行470亿大模型:上交大发布LLM手机推理框架PowerInfer-2,提速29倍

手机流畅运行470亿大模型:上交大发布LLM手机推理框架PowerInfer-2,提速29倍
6685 AI技术研报
手机流畅运行470亿大模型:上交大发布LLM手机推理框架PowerInfer-2,提速29倍

用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高

用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高
8636 AI技术研报
用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高

单个4090可推理,2000亿稀疏大模型「天工MoE」开源

单个4090可推理,2000亿稀疏大模型「天工MoE」开源
8660 AI技术研报
单个4090可推理,2000亿稀疏大模型「天工MoE」开源

ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT

ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT
8348 AI技术研报
ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT

马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B

马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B
7472 AI技术研报
马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B

模块化重构LLaVA,替换组件只需添加1-2个文件,开源TinyLLaVA Factory来了

模块化重构LLaVA,替换组件只需添加1-2个文件,开源TinyLLaVA Factory来了
8900 AI技术研报
模块化重构LLaVA,替换组件只需添加1-2个文件,开源TinyLLaVA Factory来了

只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调
8056 AI技术研报
只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

大模型落地手机打出“组合拳”,核心是找到平衡点

大模型落地手机打出“组合拳”,核心是找到平衡点
8225 AI资讯
大模型落地手机打出“组合拳”,核心是找到平衡点
上一页 当前第14页,共19页 下一页
沪ICP备2023015588号