网大论坛

 找回密码
 立即注册
查看: 1015|回复: 2

黄仁勋又投了个复旦计算机校友

[复制链接]

高级战友

Rank: 4

469

积分

0

贡献

0

奖励
发表于 2025-9-5 21:16:33 来自手机 | 显示全部楼层 |阅读模式
黄仁勋又投了个复旦计算机校友 ,这次是男生
; l) l3 l) D0 G% s# B6 x7 u: d+ {& {
黄仁勋投了个复旦学霸/ |- k2 p0 w7 X% P% B
蒲凡 东四十条资本 2025年09月05日 10:03 北京
; x/ ~9 i# B% N
/ s: ?/ \* V; m0 W一部标准的硅谷精英奋斗史。
0 y# A# U& B3 I( ^, r+ l: b# y& q/ i9 r- R
作者丨蒲凡来源丨东四十条资本2022年5月,美国国家公路交通安全管理局(NHTSA)发布了一组让人费解的数据:调查显示,2021年全美的汽车行驶总里程相较于2019年的3.3万英里下降了1%,但2021年因为交通事故死亡的人数却达到了4.29万人,创造了自2005年以来的最高纪录。同时,2021年的总死亡人数相较于2020年上涨了10.5%,这个数字也创造了有数据统计以来的最高增幅。# g! l- R4 y/ b

6 A' i( W1 A/ V& {车开得少了,事故却多了,这是怎么一回事?
4 }( b* X) c# E' z
4 w9 J: Y8 |" t. Y8 ^, h人命关天,Everyone lives matter。巨大的舆论争议下,各大机构和相关的研究团队很快展开了后续调查,并找到了这样的数据:2021年,全美能够统计到的汽车出行中,有52%的出行距离不到3英里,有28%的不到1英里。同时,超过50公里的长距离出行占比不到1%。进一步分析这些短途出行,研究人员们发现大部分出行都是前往当地的商业区进行购物、娱乐、聚会。尤其是对于那些已经成家立业的人来说,88%的美国家庭每周至少一次会开车往返大型的商业区。1 A& A4 L% c( q+ _

; a" U# k  e- U. |: m1 P1 D一系列数据整理下来,答案逐渐清晰:虽然在疫情的影响下,人们减少了出行旅游的需求,但是基本衣食住行、吃喝玩乐永远是刚需,这就让越来越多的汽车出行集中在商场、超市这样的人员密集区域。再加上人是会累的、眼睛是会疲劳的,注意力总是会不集中的,而疫情的存在放大了这一因素,交通事故的风险也就随之成倍增加了。% R  ~- t( o/ j4 D9 e( |

) P0 ]# H* B- a& z) i于是在那一年NHTSA推出了一项“全民道路安全”计划,将在五年内投资高达60亿美元,用于各项能够减少交通事故的工作,其中7.4亿美元将用来投资相关的安全技术提升。时任NHTSA副局长史蒂文·克里夫发出了这样的呼吁:“我们的交通正在发生一场迫在眉睫的危机,需要所有人——地方政府、汽车制造商和驾驶员——的参与。”
- Q# |/ \+ p1 y0 V( |2 v: l0 w% O9 v5 S
也正是那一年,“人为因素”更少、看起来更便于大数据管理的无人驾驶迎来了一段前所未有的红利期:比如无人驾驶独角兽Cruise,就在2022年完成了被收购前的最后一次外部融资,软银把手中的股份卖给了通用汽车,估值超过了300亿美元;比如谷歌孵化了超过10年的无人驾驶项目Waymo就2022年启动了载人试运行,并于年底正式拿到了洛杉矶的出租车营运许可证。2 R. H+ ^% L" u4 J# ]5 J
2 P% N, F4 w% W) T& S
在这波革命性的创业潮里,还有一位中国小伙子的身影,他所创办的Nuro已经成为了自动驾驶领域的超级独角兽,2021年巅峰时期估值一度高达86亿美元(约合人民币614.35亿元)。而最近,他又争取到了Uber和英伟达的支持,顺利完成了E轮系列融资,在这一轮中拿到了2.03亿美元(约合14.5亿元人民币)——算上这笔钱,Nuro自成立以来已经累计融资23亿美元(约合人民币164亿元)。
. o% O) J2 t; b& k  Q/ h; Y2 \+ |" z! C7 T
(黄仁勋在Nuro汽车旁边接受采访,图源:朱佳俊的社媒)
" }1 A/ ^+ d  D  \
7 {& U# e, q2 e从复旦学霸到硅谷天才
. ^" C' I$ \" {. `( ~: m  r
) t# b. J7 T) ]( [8 j这位抓住红利的中国小伙子名叫朱佳俊,是一位非常“标准”的硅谷华人精英:. n3 Y" G# G! U+ d3 V

. Q& Z; _# k) O9 H朱佳俊从小就接受了非常良好的“技能培养”,从7岁开始学美术,先后取得过上海市的室外写生比赛一等奖、全国的油画比赛二等奖;上中学之后,他开始表现出数学、物理方面的天赋,把发明交流电的传奇科学家尼古拉·特斯拉视为偶像,自己编写了一段“画函数图形”的程序来帮自己做作业;高中毕业后,他如愿考入了复旦大学计算机系,并开始全面兑现天赋,大三就开发出了一款音乐协作软件,拿到了微软创新杯全球学生软件大赛的中国区亚军,拿到了微软研究院的实习机会。1 Q$ m3 D: B" b" Y' R, A9 p
从时间线上来看,朱佳俊的创业故事,也是一部标准的硅谷精英奋斗史:
  G! E; N' N. P3 @" l; v  `: t' a6 M& u! @& Z, W0 H, m# J
本科毕业之后,朱佳俊前往弗吉尼亚大学攻读计算机科学的硕士学位,并在读书期间积极参与了各项学术交流活动,也随之迎来了他的人生转折点——在参加SIGGRAPH(一个面向计算机图形学和交互技术的学术论坛)期间,他被谷歌展台迷得走不动道,久久不愿意离场,成功地引起了谷歌参展成员之一、谷歌街景团队的创始人卢奇·维森特(Luc Vincent)的好奇。: g( F+ |) c' W9 E, g

' _1 e9 ~0 O1 Y& [% d朱佳俊对卢奇说,自己的课题方向,就是“通过分析平面照片还原图中建筑物的位置和3D结构”。卢奇对朱佳俊说,你的方向很符合谷歌街景的需求,但谷歌街景不仅仅满足于呈现“3D世界”,未来还将涉足一个叫“人工智能”的领域,让谷歌街景呈现的世界更智能、更生动,“如果你有兴趣,毕业之后可以来谷歌看看,这是我的名片”。- a; g8 v; C" @$ \/ M

4 x/ o+ G' @. B+ r; S. V, A1 |3个月后,完成了课题答辩的朱佳俊给卢奇发了一封邮件,顺利拿到了谷歌的实习机会。卢奇则在实习的第一天,就把谷歌街景的所有关键数据都扔给了朱佳俊,告诉他“一切自己看着办,没有特定的任务”。
: ~% M- N" {" D' H6 S接着就像所有传奇的创业故事那样,伯乐巧识千里马,刘备草庐遇孔明。卢奇的充分信任,换来了超预期的惊喜,朱佳俊用3周时间开发了一款名为”click-to-go”的插件,大大优化了谷歌街景用户们的使用体验。在此之前,用户其实没办法用谷歌街景完成“赛博散步”,无法从一个街景前往另一个街景,只能通过软件给予的一个既定箭头来选择前进方向,非常死板。有了“click-to-go”之后,图中任意点都可以变成起点或者终点。- n& u  Z' Z( ~& F. K5 R. ?

  R3 Z9 v4 Q7 T6 o这个插件彻底打动了卢奇,实习offer直接变成了工作offer。朱佳俊也在充分思考后,接受了卢奇的邀请,放弃弗吉尼亚大学的研究生课程,正式加入了谷歌,在谷歌X实验室(Google X Lab)中任职。
3 W! ?0 X- n5 F, M6 N1 n+ F在X实验室,朱佳俊能够接触很多前沿项目,例如Project Glass(智能眼镜)、Self-Driving Car(自动驾驶汽车)。他在其中负责“感知”部分的技术开发,领导着一支名为“Crystal ball”(水晶球)的仿真团队,后来正是这支团队写下了谷歌的无人驾驶项目Waymo的第一版感知系统,朱佳俊也因此成为了Waymo成立时的核心五人组之一。
4 m, w) p6 }7 @1 `( }( S( x, S而在X实验室中,还有另外一支负责视觉、预测和场景理解技术开发的团队,名为“Magic”,负责人是戴夫·弗格森(Dave Ferguson)。在Waymo起步阶段,他同样成为了核心五人组成员,承担了大量的开发任务,并和朱佳俊成为了无话不谈的好朋友——而这也是Nuro创业故事的起点:: D/ r8 ?+ ]6 n! f+ ?: ^
. d# A7 {6 C) R" f+ b1 W3 E$ ^5 U
2016年,在成功开发出“世界上第一款能够在公共道路上实现完全无人驾驶的汽车”后,谷歌决定将无人驾驶项目拆分出来,以Waymo为名,成立了一家同属于母公司Alphabet的独立实体。在架构调整中,他们给朱佳俊和戴夫这些核心成员提供了两个选择,要么和Waymo签下一份8年的劳动合同,继续领导团队,要么拿一笔遣散费离开团队另谋高就。
5 L6 g) A, N& E4 T2 r% H0 O' I$ R# O- e6 _' B, z
朱佳俊和戴夫都选择了后者,他们分别都拿到了4000万美元的“遣散费”。几周之后,这笔钱成为了他俩创业的启动资金,Nuro正式成立。据说,这个名字来自于阿拉伯语“Nur”,意为“天使之光”。我认为这个说法可信度很高,因为Nuro官网上的slogan也表达了这一层含义:“让所有人、所有道路、所有旅程,都能享受自动驾驶”。
8 ]( V% e5 d( v; n: x0 i' y+ @(戴夫与朱佳俊,图源:朱佳俊的社媒)" d. `7 |, c! S# k5 F: \
7 f$ O; t$ C! T- K
从无人配送到自动驾驶2 o( I* I% G) ]6 t0 Y

; h. k% u( G/ ]) t- y5 `0 x朱佳俊的个人成长故事很像爽文,Nuro的成长之路看起来也很像爽文。自2016年成立以来,他们几乎从不缺乏资本市场的支持:: {) Q" {( O8 K% Y- Q& n: {& m7 K
4 d" N' F/ Q4 Z! W6 L6 Q
2018年,Nuro完成的首轮融资规模就高达9200万美元,投资方为大名鼎鼎的Greylock和高榕资本;2019年,软银成为了Nuro的新投资方,投资规模为9.4亿美元,Nuro也就此仅用了3年时间跨过了独角兽门槛,估值达到了27亿美元;2020年,Nuro完成了由T. Rowe Price Group(普信集团)领投的C轮融资,估值再次暴涨到了50亿美元;2021年,Nuro完成了D轮融资,这轮融资由老虎基金领投,朱佳俊和戴夫的老东家谷歌也成为了投资方,估值也达到了86亿美元。
. y( L. I2 p5 ]/ t3 N5 a
" P! |3 u$ @- `/ N但这样的数字,很容易让人们忽略Nuro发展过程中的波折:( U( N4 y" e  w, C
. N. z% i' {; e& P" Z0 o- ]- r
或许是为了找到PMF,也或许是Waymo时期的经验教训,朱佳俊和戴夫创业之后选择了一条非常有差异化的产品路线——无人物流配送。2 E0 M/ K+ d& J& h( \
以他们的明星产品、与公司同名的第三代无人货运车“Nuro”为例。从外形来看,Nuro是一辆顶着摄像头的面包车,准载是500磅(大概400来斤),最高时速为45英里/小时(大概70多公里/小时),内部隔间可以保持零下40℃到零上20℃的恒温,由行车电脑还随时自适应外部环境来控制能耗。同时为了安全起见,Nuro还配合了一个外部的安全气囊,来保证路人们的安全。% S6 [9 l+ y- e9 p* Q0 v
6 O' v2 t" x, \2 E9 `* Z# p
(外部的安全气囊,来源:Nuro官网)
+ _$ p+ _: o) m一切看起来都很完美,市场场景也很现实。但问题在于,造车是有成本的,而朱佳俊和戴夫又是个理想主义者。
7 X* x( n% q% Q/ v+ j
2 K; Q  }! r1 V1 F3 _: p这两件事交织在一起,决定了Nuro最初的发展路线:不仅要自己开发无人驾驶软件,还要自己造车。2018年1月他们发布首款产品R1的时候,有媒体就这样写道:“Nuro(在自动驾驶领域)另辟蹊径,没有选择为一辆福克斯装上自动驾驶插件,而是从0打造了一款全新的汽车……虽然乍看上去就像一颗带轮子的面包机。”4 `! [: R5 A% a7 T  }5 v0 R  B: C5 B

4 l! e; o$ N' p! Z* XNuro的早期融资也有相当一部分,投入到这“造车”这件事上。例如2020年,Nuro全资收购了自动驾驶卡车研发商 Ike——Ike在当时的估值为2.5亿美元,在一众自动驾驶卡车企业中,他们的优势在于卡车系统方案、运动规划和仿真模拟。2021年8月,他们还宣布将投资4000万美元,在美国内华达州建设一条汽车生产线,以及一块用来测试无人驾驶性能的场地。
0 e6 ^8 D# M: n7 j  s
' s( L3 i8 E) ?. v9 Y  G. W3 A1 f结果如何,只能说“战报可以骗人,但战线不会”。当Nuro正式上路进行测试的时候,他们老老实实地选择了丰田普锐斯作为载具。
# S3 |0 s3 n) |3 p6 m另一方面,不仅造车有成本,用车也有成本。要说服客户们放弃“人拉马拽”的传统物流思维,转而采用他们提供的这种“超现实主义”的物流工具,实在是有些难度。具体到业务层面,他们虽然和美国的知名零售连锁Kroger、知名披萨品牌达美乐、知名便利店711都达成了合作,但基本都是区域性质的,甚至是街道性质的。
7 C3 ]) F3 y+ V: o8 p# s8 \几方面因素影响下,Nuro实际上一直没有找到稳定的盈利模式。最终在2022年11月和2023年5月,Nuro分别裁员了300人和340人,在断臂求生的同时,暂时了原本的产品开发计划,转变了整个战略方向,从追求生产整车逐渐调整为纯研发的技术授权模式。5 p$ Q! w$ ?: O& W, e0 ?
换句话说,与2016年刚刚成立时相比,Nuro已经是一家全新的、二次创业的公司了。这也解释了为什么在本次融资中,Nuro的估值从2021年的86亿美元下滑到了60亿美元,毕竟估值的基本盘已经完全不同了。
0 w( {( w: e: L# b' P; T; h2 ^7 d本次所引进的新投资方也一定程度上能体现战略方向的调整。Nuro的本次E轮融资一共分两个阶段进行,第一阶段在今年4月完成,主要投资方还是以财务投资人为主,包括普信集团、富达资本、老虎环球基金、Greylock,规模为1.06亿美元。而在前不久的第二阶段中,他们所引进的投资方以产业资本为主,包括英伟达、Uber、Uber的早期投资方Kindred Ventures、地平线的知名“超长期投资者”Baillie Gifford。1 k& ~" Y( X% F$ P) f
根据报道,英伟达和Nuro的合作,是基于双方长期以来的深度合作——目前Nuro大规模使用英伟达的GPU进行数据处理和模型训练,其最新的计算模型也是基于Nvidia Drive AGX Thor平台的构建。而Uber之所以选择Nuro,是因为他们投资了一家自动驾驶汽车生产商Lucid,并且计划6年内至少生产2万辆Gravity SUV投入到运营当中——而Nuro为这辆车提供了重要的大脑,戴夫就表示双方的合作谈了整整一年,“目前Lucid和Nuro的工程师们已经取得了实质性的进展。”
1 {3 [  E. I$ N. ^& ~& e当然,没人知道“实质性”的进展到底是一个什么样的程度。根据Uber的计划,Gravity SUV实际上要在2026年之后才会正式投入市场。包括戴夫自己也承认,Uber在敲定合作之前“接触了市面上几乎所有的软件开发商”,大有渣男到处撒网养鱼的味道。再考虑到美利坚现阶段的工业制造能力,考虑到美利坚制造业悠久的跳票习惯,这中间充满了不确定性。
; U1 t4 N2 H9 ^# w7 n但或许就像当年毅然放弃研究生学业,加入谷歌X实验室,最终创造惊喜,谁又能笃定这位像极了创业电影主角的上海男孩,不会再次柳暗花明呢?
2 D* w, K/ n0 v6 U加油,朱同学

高级战友

Rank: 4

469

积分

0

贡献

0

奖励
 楼主| 发表于 2025-9-5 21:17:53 来自手机 | 显示全部楼层
上次投的女生,是搞ai的
! _! `( [, ]/ {, B  n8 q, `: J2 L; f: c/ Q& T! k! B' I0 }
288亿独角兽即将诞生!复旦才女创业,被黄仁勋和“苏妈”同时看中
+ _' c$ _, K* A  n) ?. n0 P) b9 s8 O' H& L, `8 ?3 [9 k) }- l; {% L# S! A
创业邦 2025年08月13日 11:44 北京 548人
5 s' u: Q, E) `& D: l. R7 w2 J
1 J4 c# Q: A0 o$ z- Z, {「奔向AGI」栏目聚焦AI大模型、AI agent、AI应用、芯片、机器人等前沿、热门的AI技术和商业创新。; p0 c  k5 \( d' O2 r6 K) d# w
作者丨巴里编辑丨关雎图源丨Fireworks AI官网
* A+ b- [, Y# c. U3 O$ F
. g; x3 {, t& b6 x4 q/ Y; G又一位华人女性即将在美国科技领域书写新传奇。/ E, j. u# b4 P6 U5 t: v

) n+ C2 H1 D# q; b+ D据科技媒体The Information消息,人工智能云服务初创公司Fireworks AI,正计划启动新一轮融资,目标估值达40亿美元(约合288亿元人民币,该估值已包含本轮融资金额)。
# n3 S4 t4 B% T$ f; g5 |9 K$ t
' p; `5 j& k) o: o1 ~目前,知名风投机构Lightspeed Venture Partners(美国光速创投)与Index Ventures等正就领投事宜展开深入磋商。, s! r8 L4 z4 E
若此次融资顺利达成,Fireworks AI的估值将在短短一年内实现超7倍的飞跃。这也再次凸显了投资机构对AI基础设施领域,特别是推理服务赛道的浓厚兴趣。" Z. s, c7 }3 n4 M
/ w# [3 r3 G. F, ^, T
值得一提的是,这家公司已获得多家顶级投资机构的青睐。此前,红杉资本、Benchmark等硅谷老牌风投,以及英伟达、AMD、Databricks Ventures和MongoDB Ventures等产业资本均已参与其早期融资。/ e: |' A) y  @  q7 |$ f( l
- T; ?6 N0 g3 R+ W2 z. s6 g$ k! w# T
" b! S7 L4 {' R! W- {/ c
复旦才女创业帮企业低成本、高效定制开源大模型% y1 q9 C6 j( P$ p. D6 K
这位复旦计算机系校友正悄然改写AI基础设施的竞争规则。
: b* ~7 ]9 U3 `# L6 r4 L
  R1 S- @) j( U% h2 A4 |7 B乔琳(Lin Qiao)在复旦大学计算机本硕连读毕业后,便远赴加州大学圣巴巴拉分校(UC Santa Barbara)攻读计算机博士学位。( S4 ?& }( P( O1 T. @3 M
  ]* p3 v) u$ g; z8 j
她的职业生涯始于IBM担任研究职位,专注于数据基础设施和数据库技术,随后在LinkedIn担任技术主管,最终在Meta(原Facebook)担任AI平台架构关键负责人,曾领导超过300人的工程师团队,主导全球PyTorch框架的基础设施研发及大规模部署。
% s  [. F* E0 B( ?$ s6 Y! W
) Z* j- i! I# A此后,她带领团队成功推动PyTorch成为行业标杆的开源框架,并将其部署至Meta的全球数据中心、移动设备和AR/VR平台。
' C0 Z" u3 Y/ Z  K2 d) I5 D: @* r% v/ i1 @5 Y
Fireworks AI联合创始人兼首席执行官乔琳(Lin Qiao),图源:The Information) g' b6 t2 E! x$ v, h
, x5 x, H/ P! g: ^. q( a2 I
这段在科技巨头打磨的经历,为乔琳积累了深厚的AI底层架构研发经验。
6 O0 e, n# X3 p% x* h  E" z0 n2 \, B2 a. f
作为全球主流开源机器学习框架PyTorch的关键建设者,她带领团队攻克的技术难题,如今正转化为Fireworks AI的核心竞争力。1 b7 a: R, \8 ~6 ?
, w' N% ]* E1 |* w" s
当年在Meta,乔琳见证了一个重要规律:PyTorch之所以能在数十个同类框架竞争中胜出,关键在于"把复杂留给团队,把简单带给用户"的设计哲学。/ W5 x1 v3 g$ `" D7 N

& q$ m( [& Z0 c6 N尽管背后是数百名工程师构建的复杂技术体系,但开发者只需简单调用即可获得强大功能——这种用户体验至上的理念,成为她创立Fireworks AI的初心。
6 U7 w& u1 j3 b% W
" s1 |& z( {3 N$ x* k6 u4 f# f" T"真正的创新不在于功能堆砌,而在于让技术回归本质。"乔琳将这种思考注入创业实践。
! X1 w- g3 H  ]7 m6 p. \
: a5 t. p8 z% V. ]( ?2022年,Fireworks AI在美国加州雷德伍德市创立。- q3 \, q; D% u, J% v! k% T8 R
: H" t1 ?5 R2 d
Fireworks AI的创始团队堪称"梦之队":六位参与过Meta PyTorch项目的资深工程师与一位前谷歌AI专家组成核心技术班底,他们延续着乔琳在PyTorch时期沉淀的方法论——前端保持极致简洁,后端承载海量优化。
3 m+ K/ Z7 K2 ]. I8 Y# I% _
+ J9 ~, x3 F1 i+ T, F) Z3 w& jFireworks AI创始团队,图源:Fireworks AI官网
5 l. n" m) d& }  w5 ^就像当年Meta投入数百名工程师构建PyTorch生态却让开发者感受不到复杂度那样,Fireworks AI团队默默攻克着分布式推理引擎等8万多种配置组合的技术难关,却将流畅体验留给终端用户。" o* P  \# y) K, k" P; [' L

" A0 T1 n9 ]9 V9 x5 @在乔琳看来,当前AI领域的变革深度远超以往任何技术革命。"这不仅是简单的产业升级,而是整个技术底座的地壳重构。"8 J$ b0 ?: [( N+ ^  w) X# @: h
/ G+ k  [3 m8 [3 j
她敏锐洞察到生成式AI带来的范式转移:传统机器学习时代,企业需要从零搭建模型;而通用人工智能(GenAI)的出现,让创新焦点从"构建"转向"应用"。
/ E: J% F6 g  S4 H2 b" G6 K5 c4 J8 z% G1 h# x& W3 W
这种转变催生了爆炸式的市场机遇——全球AI初创企业如雨后春笋般涌现,传统企业与数字原生势力也争相涌入,试图通过AI重构产品体验与服务流程。
9 n! Q5 E: r6 r8 M# k
! B6 T' j( g4 t4 ?- \3 i8 {2 Y市场调研显示,尽管生成式AI技术门槛大幅降低,但企业仍面临基础设施、专业人才与算力资源的三大瓶颈。
2 O7 z* R( K$ O5 L# `9 a% k: n1 m8 l9 T4 x/ M
正是瞄准这个广阔的市场,Fireworks AI开创了独特的商业模式——“推理服务提供商”(inference provider)。2 C) k( ?4 w% r: I
$ G7 \! \: ^: Z2 }- _
Fireworks AI核心在于帮助企业用更低的成本、更高的效率运行和定制开源大模型,比如深度求索的 DeepSeek、阿里云的 Qwen,还有 Meta 的 Llama。  \6 y4 p; G3 H7 K% r4 ^- |* d

; K* e+ a; R3 k5 b( |& N这些模型原本可能需要企业自己购买 GPU 服务器来运行,但 Fireworks 换了个更灵活的方式——他们租用第三方的英伟达服务器,然后通过 API 接口直接给开发者提供这些开源模型的推理能力。开发者用起来就像调用 OpenAI 的 GPT-4o 一样方便,不用操心底层服务器的事情。
) Z, e, C% r/ R* k1 Q5 t9 I9 p+ w- Q5 i/ O2 i1 p
他们的核心优势还在于对 GPU 资源做了深度优化:通过自研的 Fire Attention 推理引擎等技术,能让模型推理更快、更省资源,最终帮助客户降低使用成本。
8 r# h6 V. l" j) Z% C" k6 C7 @* }$ Y$ C
- D+ v( ]; b+ r! }" U在这背后,是乔琳对行业趋势的深刻判断。% P+ |% j2 N- O! L& b" F
4 w6 Y& n" u1 Q( V) z8 Q% G
"当基础模型的质量与规模逐渐趋同时,企业级差异化竞争的关键,在于如何用专有数据锻造独特价值。"0 \+ k0 A( p. i* D
$ j1 \9 ~+ q  t4 P* p. t8 T
她指出,无论是开源还是闭源的大语言模型,其底层架构与数据边界终将收敛,而真正构筑护城河的,是如何通过模型微调将企业的商业模式、运营逻辑与AI能力深度融合。
5 r5 v( o6 l) ?; ^3 ~! ~3 t) |3 }/ Z8 E
8 w1 T: t) d$ R6 k9 Y7 E6 L9 |- @% K这正是Fireworks AI致力解决的核心命题——让每家企业都能基于自身数据土壤,培育出独具竞争力的AI应用之花。
" l: t  a$ ?" G4 h8 J
! g, d9 X0 o6 a( V让AI编程工具效率起飞说句话就能让AI改好代码  `+ f1 ^! z0 e- b% b1 B
具体来说,Fireworks AI的产品体系分为多个技术层级,最底层是自研的分布式推理引擎,这个引擎是专门为生成式AI打造的,就像是为PyTorch量身定做的推理基础设施。
# ]  d3 r; r( p* `3 L& r这个引擎设计得非常灵活,像搭积木一样可以自由组合,这样Fireworks AI就能在新开源模型发布的当天就快速上线。9 l9 @) {2 c( X- N" G

# E+ M3 S2 p# Q8 x* ?/ Y- H之所以能做到这么快,是因为Fireworks AI借鉴了PyTorch的设计理念,把系统做得模块化且可灵活配置。/ @! u. a$ \2 J; U4 P
5 G4 f7 L0 a  o3 T
在服务模式上,Fireworks AI不会用"一刀切"的方案——不存在一个能解决所有问题的万能模型,也不会有适合所有使用场景的最佳配置。
' o1 Y% Y7 Z9 P! H0 n: I
# m& n' k( i* ]每个用户的需求都不一样,就像买衣服要选合适的尺码一样,Fireworks AI为用户提供的是可以根据质量、速度和成本这三个维度来定制的解决方案。' v. l1 \. R$ O' r, V, L

4 c* @, k, Z9 F比如有的用户更看重回答质量,有的需要更快的响应速度,还有的要考虑成本控制,系统会帮他们找到最适合自己需求的平衡点。+ f: n+ l0 e  q2 E( ]' u( |

. M. ~- k$ h8 u为了实现这个目标,Fireworks AI开发了一个叫Fire Optimizer的工具。这个工具就像是个智能助手,能根据用户的具体需求(比如想要更快的响应还是更高的质量),自动调整模型的配置和部署方案。* S# [$ v( p* ^! d  }- [+ h

* n0 l1 ]+ h$ a. ~! o这个工具通常会在现有的数百个模型中选择一个合适的,然后通过各种方法来优化,比如:2 F' p/ ?3 J# m+ l3 V  x
1. 量化技术:用更低的精度运行模型(比如用8位甚至4位数字代替原来的16位),这样能大幅提升计算效率,就像把高清视频压缩成流畅的短视频一样;7 j5 O* Q; x( P% r( m
2. 推测执行:让模型一次预测多个答案(比如一次猜4个词而不是1个),使推理速度成倍提升;
5 M, _4 P' k) {  O% [  n& {3. 模型组合:用小模型先快速给出答案,如果不确定再让大模型来确认,兼顾效率与准确性。! C- L" H* x2 i7 J& d* e) r  ^
这些优化方法有很多细节和技巧,比如量化可以应用在模型的不同部分(权重、激活值等),每种方法对最终结果的影响都不一样,需要根据用户的具体需求来选择。
; Q/ y* `% j9 A虽然这些选项听起来有点复杂,但Fireworks AI的目标就是让用户不必操心这些技术细节,系统会自动帮他们找到最好的解决方案。( `- G: V8 e, ~6 n7 ?+ O; E

3 q2 Y  v. y# r商业化上,Fireworks AI 近期的年化收入已经突破 2 亿美元(约合14亿元人民币),即每月近 1,700 万美元(约合1.22亿元人民币),公司预计年底将增至3亿美元(约合22亿元人民币)。- {- D' v& v" q* i& _
5 |1 ~7 t+ z5 O5 V7 @' S4 g! d
其业务扩张离不开本身就在快速增长的 AI 原生应用公司,例如AI编程独角兽Cursor、AI搜索独角兽Perplexity等快速崛起的客户支持。% ]$ I; T* {* @- C. q: h
* j* @6 G- d0 u8 ?
那么,AI编程工具Cursor是怎么借助Fireworks AI的技术,让写代码比普通方法快好几倍呢?& q$ d5 l9 V3 ]2 A
Cursor是个专门给程序员用的智能编程工具,能预测你的操作(比如刚改几行代码,它就能猜到你下一步想干啥)、用自然语言改代码(比如跟它说“把这部分改成xxx”)、一键把生成的代码丢进文件里用,还能“看懂”整个项目的代码并直接帮你改好。" Y" U4 v1 y  ~. n( f6 t
但程序员用这类工具时有个大麻烦:想让AI改一大段代码(比如几百行),现有的AI模型(像GPT-4、GPT-4o)经常改得慢、不准,甚至越改越乱,特别影响效率。, X4 k, B5 C; \4 Y' n
为了解决这个难题,Cursor专门训练了一个新模型,专门处理“快速改代码”的任务(称作“Fast Apply”),在700亿参数的大模型上每秒能生成约1000个token(大概3500个字符),比GPT-4和GPT-4o快多了,训练数据用的是程序员平时用指令改代码的输入和真实操作数据,针对性很强。+ O' Z$ p' O& h( I7 g3 K& T4 V
不过光有厉害的模型还不够,还得让它跑得更快。Fireworks给Cursor提供了底层支持,用了两个关键技术:* S' H2 t( E2 a( w7 h
一是把Cursor的模型部署到自己的推理引擎上,还针对“改代码”任务做了性能优化;# b5 @& l! }4 f1 ?' e' ~/ y) l
二是用了推测解码技术——普通AI生成代码得一个token一个token慢慢算,但推测解码能“猜”接下来可能出现的多个token(比如一次猜好几个词),然后一次性验证这些猜测对不对,对的就直接用,错的再调整,这样就能同时处理好多token,速度直接起飞。
1 j- H6 P. P) S( C* a9 yCursor还搞了个升级版“推测编辑”,专门针对改代码的场景,比如改一大段文字时,AI能根据你之前的操作大胆猜“你可能想把这几行改成xxx”,然后一次性生成好长一段再快速验证,Fireworks用这个技术让Cursor的模型速度飙到每秒1000个token,比普通推理快13倍,比之前用GPT-4的版本也快了9倍。& C" ]* h) a! W) o0 }5 W
效果就是程序员改几百行代码几秒钟就能出结果,不用等半天,而且虽然猜得快,但最后还会用“严格模式”检查一遍,确保代码是对的。
, n( o+ ?' m6 \- W# t) U& i可以说,如今程序员点个按钮就能把AI生成的代码直接丢进项目里,或者一句话让AI改好代码,效率直接拉满。7 m! n) B" m5 x: l8 Z

& m( `" k; E% A6 K. h英伟达投资Fireworks AI后亲自杀入推理服务$ M# q2 c; Z2 E1 M% U' ]4 T
当前竞争格局中,Fireworks AI的直接对手包括Together AI和Baseten。$ x0 ^9 N0 i  s7 ^3 T1 L1 }2 X
以Together为例,其今年3月年化营收达1.5亿美元(约合11亿元人民币),即每月约 1250万美元(约合9000万元人民币),估值30亿美元(约合216亿元人民币)。7 {4 J% t! f. S  {
但整个赛道面临更强劲的对手——英伟达今年3月收购推理服务商Lepton后,强势推出GPU云服务市场,直接切入了Fireworks AI的核心业务领域。
) }- y$ k! Q' \! y8 R8 X8 e投行分析指出,若大型云服务商为降低AI训练推理成本、提供定制化服务而整合产业链,这类初创企业很有可能成为潜在收购目标。1 w% X6 i& L. f" g1 y  T
同时,Fireworks也面临盈利挑战:虽毛利率约50%(与同行相当),但低于订阅制软件常见的70%水平。
- y# i) _+ R- d6 J( a这主要因为需预留大量服务器应对需求峰值,同时承受来自CoreWeave等GPU云商家的低价竞争。为此,公司正通过持续优化GPU资源效率提升毛利率至60%,并将此列为重点战略方向。' d7 u! E! u! a" }6 d6 G
尽管如此,投资机构仍然看好Fireworks AI的潜力。7 h8 l: [4 c/ [  |
睿兽分析显示,Fireworks AI成立至今已经完成共计7,700 万美元的两轮融资。B轮融资过后,公司估值达到5.52亿美元(约合40亿元人民币),投资方包括红杉资本、Benchmark等顶级风投,以及英伟达、AMD、Databricks Ventures和MongoDB Ventures等产业资本。
% r6 {% A" ~9 N7 J2 ~& Y8 c可以说,乔琳是被英伟达创始人兼CEO黄仁勋和“芯片女王”AMD董事长兼CEO苏姿丰同时看中的创业者。: p2 c' G& v' z5 D
) R' m5 d1 K) w( k* Q( r
乔琳透露,FireworksAI未来一年的核心战略是强化Fire Optimizer系统——该智能优化工具能在模型质量、响应速度、成本之间自动寻找最优解。; F& K  r  L) _, S# i
目前,Fire Optimizer已经在响应速度和成本控制上做的足够好,接下来会特别强化在推理质量上的能力。通过个性化定制,能够让模型效果比通用模型或普通API强得多,特别是当加入客户自己的业务数据后,效果会更为出色。+ e' ?% u# o6 }) h. G
尽管用户体验容易被复制,但真正拉开差距的护城河是企业自己积累的数据和用户使用习惯——这些数据形成的反馈循环特别重要,会直接反哺到他们使用的AI模型里。3 n5 H( s6 g! f/ A/ X" _
乔琳预测,2025年将成为"Agent年"和"开源模型年"。4 p) S& e5 t2 E! V( V
各行业将涌现大量解决垂直问题的AI智能体,同时开源模型将迎来井喷式发展——就像DeepSeek当时发布仅一个月,Hugging Face上就出现了500多个优化版本,还成功将其适配到各种设备和云平台上,Perplexity和她的客户Linnk还开发了针对金融服务的定制版本。7 m0 C( W) I- }) ^% [3 P, c& ]7 `
不过,她也指出,未来最大的挑战在于:
+ b/ P& C" l! d; M! E如何让快速发展的AI智能体和开源模型更好地结合,在最后一公里实现质量优化,为用户提供更好的实时体验。这也是FireworksAI公司今年要重点解决的问题——简化开发者在这方面的工作流程。# b6 |4 J6 ?, Y' n2 u" D
在4月纽约举办的行业峰会上,乔琳展示了团队的终极愿景:"我们赌定那些真正懂产品的开发者。谁能玩转自己的数据、调教出更聪明的模型,谁就能赢到最后。"
0 c3 Y) o& u& }7 Q3 P6 y4 PFireworksAI要做的,就是提供工具与基础设施,帮助开发者定制模型、注入数据,全面提升推理质量、速度与并发能力——让每个用心打磨产品的团队,都能站上AI时代的聚光灯下。" S1 y9 Q( T) Y0 S9 G7 u1 I

高级战友

Rank: 4

878

积分

0

贡献

0

奖励
发表于 2025-9-14 10:46:39 来自手机 | 显示全部楼层
老黄到处投
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

论坛的微信公众号(二维码如下),关注获取更多科教信息

Archiver|手机版|网大论坛 ( (鄂ICP备2021013060号-2) )

GMT+8, 2025-9-25 05:19 , Processed in 0.031002 second(s), 23 queries , Gzip On.

鄂公网安备 42018502005923号

Powered by Discuz! X3.4

Copyright © 2001-2022, Tencent Cloud.