|
发表于 2024-8-30 21:11:23
|
显示全部楼层
( f+ u( |/ T y" b9 a4 i有型号了,未来潜力还是巨大的
6 o, o7 D, q+ t2 \2 n% D- d, [8 b目前算力不具备商业竞争力+ v7 R b* Y" d% I
: o( F; v% }/ Y一张RTX 4090 在不同精度下的理论计算性能如下:
: F. S' ?* W+ x; E, X; E u, B& U6 E1 {% ?' g' _
FP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。
& J; a8 x$ U5 T# m( r1 q% o8 [ B- R/ r) o7 C- s
FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。* |9 O! [9 i" b ?$ G3 Q
5 f; u9 G' H9 v4 N4 `% W; x
F8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
0 R3 d9 f) z7 k6 U4 u# D5 g) l/ }5 K. E! \' x3 L! x' }
新闻稿没讲FP精度,FP8的可能性比较大! N& f5 m/ X7 a2 y9 k5 V; {
也即单机柜算力很可能比490高一点9 O4 t) a a" g* s8 \4 I0 P+ ?
5 H; K; K1 {' s
目前还是小学六年级小朋友,不能和博士比
9 d5 S: C9 A+ _: G* Y. Z不在现在,在于全自主,未来可期! |
|