网大论坛

 找回密码
 立即注册
查看: 1858|回复: 6

李飞飞团队训练出媲美DeepSeek R1的推理模型 云计算费用不到50美元

[复制链接]

新手上路

Rank: 1

10

积分

0

贡献

0

奖励
发表于 2025-2-6 19:21:08 | 显示全部楼层 |阅读模式
李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。(注:“不到50美元”仅为云计算服务费用,不包括服务器、显卡等硬件投入费用,因这部分已经由云厂商承担。)

高级战友

Rank: 4

890

积分

0

贡献

0

奖励
发表于 2025-2-6 19:23:43 来自手机 | 显示全部楼层
那更完蛋了,OpenAI没法赚钱了,nv还稍微好一点

未关注公众号会员1

429

积分

0

贡献

0

奖励
发表于 2025-2-6 20:26:11 | 显示全部楼层
假消息,别上当

老战友

Rank: 5Rank: 5

1076

积分

0

贡献

0

奖励
发表于 2025-2-7 16:05:44 | 显示全部楼层
李飞飞团队“50美元”复刻DeepSeek的R1真相:基于阿里云Qwen模型监督微调而成!
中国科技,厉害了!

白银长老

Rank: 8Rank: 8

3277

积分

1

贡献

2000

奖励
发表于 2025-2-7 16:52:03 | 显示全部楼层
李飞飞团队近期宣称以不到50美元的云计算费用训练出媲美DeepSeek R1的推理模型s1,这一消息引发了广泛关注,但实际细节和效果需结合多方信息综合分析:

### 1. **“50美元”的真实性及成本构成**
   - **仅覆盖微调阶段的云计算费用**:论文提到,50美元是指基于阿里云Qwen2.5-32B-Instruct模型进行监督微调(SFT)的算力成本,具体为16张英伟达H100 GPU运行26分钟的费用,甚至更低(约20美元)。
   - **忽略基座模型和数据成本**:s1模型并非从零训练,而是基于阿里通义千问(Qwen)的开源模型微调,而Qwen的预训练成本高达数百万美元。此外,数据筛选、标注等前期人力成本也未计入50美元。

### 2. **模型性能的局限性**
   - **仅在特定测试集上表现优异**:s1在竞赛数学题(如AIME 2024和MATH 500)上的表现超过OpenAI的o1-preview模型,但与DeepSeek R1正式版相比仍有显著差距。例如,DeepSeek R1覆盖更广泛的数学场景(如金融建模、工程计算),通用性更强。
   - **依赖数据筛选和推理干预**:s1的成功主要归功于精心筛选的1000个高质量样本数据集(s1K),以及“预算强制”技术(控制模型推理时的思考长度)。实验显示,使用随机数据或未严格筛选的数据集会导致性能大幅下降。

### 3. **技术贡献与争议**
   - **小样本高效微调的验证**:s1证明了通过高质量小数据集和推理优化,可在低成本下提升模型性能。其开源的s1K数据集为后续研究提供了参考。
   - **标题夸大引发质疑**:部分报道将s1与DeepSeek R1直接对标,但实际对比对象是DeepSeek-R1 800K数据蒸馏出的32B模型(非670B的正式版)。此外,s1依赖外部基座模型(Qwen)和谷歌Gemini生成的数据,缺乏独立性。

### 4. **行业影响与伦理争议**
   - **低成本模型的潜力与局限**:s1展示了小数据+强蒸馏技术可降低算力门槛,但需依赖成熟基座模型,且无法覆盖复杂任务。这可能推动中小团队参与AI研发,但也引发对基座模型知识产权和公平使用的讨论。
   - **对传统研发模式的挑战**:若低成本微调成为主流,大公司的巨额研发投入可能受到威胁。不过,OpenAI等企业仍通过全自研技术链保持优势。

### 结论
李飞飞团队的研究确实验证了低成本微调的可能性,但**“媲美DeepSeek R1”的表述存在夸大**。s1模型的成功是高质量数据筛选、现有基座模型和推理优化的综合结果,并非完全颠覆传统训练模式。其意义在于为小样本学习和推理优化提供了新思路,而非实现通用AI的廉价化。

中级站友

Rank: 3Rank: 3

153

积分

0

贡献

0

奖励
发表于 2025-2-7 17:31:08 来自手机 | 显示全部楼层
哗众取宠

新手上路

Rank: 1

4

积分

0

贡献

0

奖励
发表于 2025-2-8 09:53:42 | 显示全部楼层
英伟达:gun
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

论坛的微信公众号(二维码如下),关注获取更多科教信息

Archiver|手机版|网大论坛 ( (鄂ICP备2021013060号-2) )

GMT+8, 2025-2-22 23:59 , Processed in 0.031615 second(s), 20 queries , Gzip On.

鄂公网安备 42018502005923号

Powered by Discuz! X3.4

Copyright © 2001-2022, Tencent Cloud.