|
deepseek大概率用知识蒸馏,人家本来只是上线了一个轻量化模型deepseek r1,然后在deepseek v3的开源文档中预算了训练一个v3这些student model需要的费用。
结果海外媒体误解报道deepseek只需要500万美金就媲美openai,这是故意误传还是有意误传不得而知,但是实际上就是造成了利用这个做空了美国科技股。
而幻方量化从来没说过他们没有teacher model,也重来没说teacher model的训练费用,当然他可能也是做空美国科技股的助力。
唯一的结论,科技没有大进步,只是一场空投针对美国科技股的一次做空运动 |
|