AI资讯新闻榜单内容搜索-训练

下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据

手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据
11805 AI技术研报
手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据

硬核解决Sora的物理bug!美国四所顶尖高校联合发布:给视频生成器装个物理引擎

硬核解决Sora的物理bug!美国四所顶尖高校联合发布:给视频生成器装个物理引擎
10231 AI技术研报
硬核解决Sora的物理bug!美国四所顶尖高校联合发布:给视频生成器装个物理引擎

看透物体的3D表示和生成模型:NUS团队提出X-Ray

看透物体的3D表示和生成模型:NUS团队提出X-Ray
5395 AI技术研报
看透物体的3D表示和生成模型:NUS团队提出X-Ray

为了给大模型找语料,有人开始进行“互联网考古”

为了给大模型找语料,有人开始进行“互联网考古”
11259 AI资讯
为了给大模型找语料,有人开始进行“互联网考古”

开源15T tokens!HuggingFace放出规模最大、质量最高预训练数据集

开源15T tokens!HuggingFace放出规模最大、质量最高预训练数据集
6649 AI技术研报
开源15T tokens!HuggingFace放出规模最大、质量最高预训练数据集

CVPR‘24:与任务无关的多模态数据也能提升Transformer性能|港中文&腾讯

CVPR‘24:与任务无关的多模态数据也能提升Transformer性能|港中文&腾讯
6273 AI技术研报
CVPR‘24:与任务无关的多模态数据也能提升Transformer性能|港中文&腾讯

一次预测多个token,Meta新模型推理加速3倍,编程任务提高17%

一次预测多个token,Meta新模型推理加速3倍,编程任务提高17%
6323 AI技术研报
一次预测多个token,Meta新模型推理加速3倍,编程任务提高17%

CVPR 2024 Highlight | 基于单曝光压缩成像,不依赖生成模型也能从单张图像中重建三维场景

CVPR 2024 Highlight | 基于单曝光压缩成像,不依赖生成模型也能从单张图像中重建三维场景
12408 AI技术研报
CVPR 2024 Highlight | 基于单曝光压缩成像,不依赖生成模型也能从单张图像中重建三维场景

小模型性能饱和、表现不佳,根源是因为Softmax?

小模型性能饱和、表现不佳,根源是因为Softmax?
11846 AI技术研报
小模型性能饱和、表现不佳,根源是因为Softmax?

终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名

终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
6700 AI技术研报
终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
上一页 当前第413页,共452页 下一页
沪ICP备2023015588号