AI资讯新闻榜单内容搜索-大语言模型

AITNT
未登录
搜索: 大语言模型

NVIDIA港大MIT联合推出Fast-dLLM v2:端到端吞吐量提升2.5倍

NVIDIA港大MIT联合推出Fast-dLLM v2:端到端吞吐量提升2.5倍
7964 AI技术研报
NVIDIA港大MIT联合推出Fast-dLLM v2:端到端吞吐量提升2.5倍

3500万美元押注一个疯狂想法:Viven让每个员工都有数字分身

3500万美元押注一个疯狂想法:Viven让每个员工都有数字分身
8888 AI资讯
3500万美元押注一个疯狂想法:Viven让每个员工都有数字分身

AI模型守法率提升11%,港科大首次用法案构建安全benchmark

AI模型守法率提升11%,港科大首次用法案构建安全benchmark
9366 AI技术研报
AI模型守法率提升11%,港科大首次用法案构建安全benchmark

RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward

RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward
6674 AI技术研报
RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward

微软BitDistill将LLM压缩到1.58比特:10倍内存节省、2.65倍CPU推理加速

微软BitDistill将LLM压缩到1.58比特:10倍内存节省、2.65倍CPU推理加速
6905 AI技术研报
微软BitDistill将LLM压缩到1.58比特:10倍内存节省、2.65倍CPU推理加速

AI智能编程新框架,节省一半时间就能“聪明”地写代码丨上海AI Lab&华师大

AI智能编程新框架,节省一半时间就能“聪明”地写代码丨上海AI Lab&华师大
8702 AI技术研报
AI智能编程新框架,节省一半时间就能“聪明”地写代码丨上海AI Lab&华师大

「重要性采样」并不「重要」?快手清华ASPO攻克重要性采样权重错配

「重要性采样」并不「重要」?快手清华ASPO攻克重要性采样权重错配
7808 AI技术研报
「重要性采样」并不「重要」?快手清华ASPO攻克重要性采样权重错配

不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出

不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出
10100 AI技术研报
不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出

LLaVA-OneVision-1.5全流程开源,8B模型预训练只需4天、1.6万美元

LLaVA-OneVision-1.5全流程开源,8B模型预训练只需4天、1.6万美元
9505 AI技术研报
LLaVA-OneVision-1.5全流程开源,8B模型预训练只需4天、1.6万美元

拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型学会“精确探索”,推理成绩飙升

拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型学会“精确探索”,推理成绩飙升
8343 AI技术研报
拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型学会“精确探索”,推理成绩飙升
上一页 当前第8页,共62页 下一页
沪ICP备2023015588号