AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

多模态训练后模型能力雪崩,上海AI Lab全面探索MLLM偏好对齐与模态融合

多模态训练后模型能力雪崩,上海AI Lab全面探索MLLM偏好对齐与模态融合
8772 AI技术研报
多模态训练后模型能力雪崩,上海AI Lab全面探索MLLM偏好对齐与模态融合

长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?
5910 AI技术研报
长文本向量模型在4K Tokens 之外形同盲区?

DeepSearch 与 DeepResearch 的设计和实现

DeepSearch 与 DeepResearch 的设计和实现
11414 AI技术研报
DeepSearch 与 DeepResearch 的设计和实现

在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架

在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架
8745 AI技术研报
在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架

多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools

多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools
7697 AI技术研报
多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools

18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集

18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集
8582 AI技术研报
18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集

神旗数码孙洋:企业流程优化,是AI落地工业场景的关键|36氪专访

神旗数码孙洋:企业流程优化,是AI落地工业场景的关键|36氪专访
9678 AI资讯
神旗数码孙洋:企业流程优化,是AI落地工业场景的关键|36氪专访

90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!

90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!
10058 AI技术研报
90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!

砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术

砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术
8360 AI技术研报
砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术

阿里开源R1-Omni,DeepSeek同款RLVR首度结合全模态情感识别,网友:可解释性+多模态学习=下一代AI

阿里开源R1-Omni,DeepSeek同款RLVR首度结合全模态情感识别,网友:可解释性+多模态学习=下一代AI
8951 AI技术研报
阿里开源R1-Omni,DeepSeek同款RLVR首度结合全模态情感识别,网友:可解释性+多模态学习=下一代AI
上一页 当前第266页,共440页 下一页
沪ICP备2023015588号