AI技术研报-这里有最前沿的人工智能技术解读

AITNT

NeurIPS 2024|SparseLLM:突破性全局剪枝技术,大语言模型稀疏化革命

NeurIPS 2024|SparseLLM:突破性全局剪枝技术,大语言模型稀疏化革命
5782 AI技术研报
NeurIPS 2024|SparseLLM:突破性全局剪枝技术,大语言模型稀疏化革命

清华微软最新力作:用物理学革新Transformer注意力,「大海捞针」精度暴涨30%!

清华微软最新力作:用物理学革新Transformer注意力,「大海捞针」精度暴涨30%!
8774 AI技术研报
清华微软最新力作:用物理学革新Transformer注意力,「大海捞针」精度暴涨30%!

综合RLHF、DPO、KTO优势,统一对齐框架UNA来了

综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
9256 AI技术研报
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了

这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机

这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机
7120 AI技术研报
这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机

上交大发布首个OpenAI o1复现项目进展报告,满满的经验洞察

上交大发布首个OpenAI o1复现项目进展报告,满满的经验洞察
6052 AI技术研报
上交大发布首个OpenAI o1复现项目进展报告,满满的经验洞察

重要的事情说两遍!Prompt「复读机」,显著提高LLM推理能力

重要的事情说两遍!Prompt「复读机」,显著提高LLM推理能力
4182 AI技术研报
重要的事情说两遍!Prompt「复读机」,显著提高LLM推理能力

陈丹琦等人组织的COLM奖项公布:被ICLR拒稿的Mamba入选杰出论文

陈丹琦等人组织的COLM奖项公布:被ICLR拒稿的Mamba入选杰出论文
9051 AI技术研报
陈丹琦等人组织的COLM奖项公布:被ICLR拒稿的Mamba入选杰出论文

「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need

「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need
4717 AI技术研报
「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need

TPAMI | 安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析

TPAMI | 安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析
4584 AI技术研报
TPAMI | 安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析

重磅:Mila和谷歌DeepMind以及微软联合发布,并非所有LLM推理者都具备相同能力

重磅:Mila和谷歌DeepMind以及微软联合发布,并非所有LLM推理者都具备相同能力
4825 AI技术研报
重磅:Mila和谷歌DeepMind以及微软联合发布,并非所有LLM推理者都具备相同能力
上一页 当前第390页,共557页 下一页
沪ICP备2023015588号