AI资讯新闻榜单内容搜索-训练

下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

大模型“自学”后能力反下降,Llama/Mistral都没逃过

大模型“自学”后能力反下降,Llama/Mistral都没逃过
9231 AI技术研报
大模型“自学”后能力反下降,Llama/Mistral都没逃过

LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了

LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了
9715 AI技术研报
LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了

华为GTS LocMoE+:高可扩展性亲和度 MoE 架构,低开销实现主动路由

华为GTS LocMoE+:高可扩展性亲和度 MoE 架构,低开销实现主动路由
6216 AI技术研报
华为GTS LocMoE+:高可扩展性亲和度 MoE 架构,低开销实现主动路由

清华提出时间序列大模型:面向通用时序分析的生成式Transformer | ICML 2024

清华提出时间序列大模型:面向通用时序分析的生成式Transformer | ICML 2024
12138 AI技术研报
清华提出时间序列大模型:面向通用时序分析的生成式Transformer | ICML 2024

「数据墙」迫近?苹果OpenAI等巨头走投无路,被迫「偷师」YouTube视频!

「数据墙」迫近?苹果OpenAI等巨头走投无路,被迫「偷师」YouTube视频!
11262 AI资讯
「数据墙」迫近?苹果OpenAI等巨头走投无路,被迫「偷师」YouTube视频!

如何将 LLM 的上下文扩展至百万级?

如何将 LLM 的上下文扩展至百万级?
6686 AI技术研报
如何将 LLM 的上下文扩展至百万级?

ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格

ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格
8807 AI资讯
ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格

OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了

OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
6906 AI资讯
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了

独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers

独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers
10380 AI资讯
独家对话李岩:宿华、经纬、红点资金支持,第一个「生成式推荐」创业公司|AI Pioneers

只激活3.8B参数,性能比肩同款7B模型!训练微调都能用,来自微软

只激活3.8B参数,性能比肩同款7B模型!训练微调都能用,来自微软
10472 AI技术研报
只激活3.8B参数,性能比肩同款7B模型!训练微调都能用,来自微软
上一页 当前第385页,共451页 下一页
沪ICP备2023015588号