|
|
发表于 2024-8-30 21:11:23
|
显示全部楼层
5 u Y2 x9 ]% E; w1 B
有型号了,未来潜力还是巨大的
' ]* |6 _+ x9 w4 x, z" c9 d目前算力不具备商业竞争力! I7 S/ t# |6 O+ O# z t3 Z# l
7 R2 U* b4 q+ \( ?* k; x
一张RTX 4090 在不同精度下的理论计算性能如下:
5 ]+ \2 ?. T4 T3 X, j" A* `
2 r' C8 H, W/ _: h; O- I0 QFP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。& x2 k! ?( J/ p! |! d' S
$ E% X7 M* L( }2 S" P6 g2 HFP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。
& m; L! O, s1 p3 s) s* P6 @
$ O: g* z# p% X5 |- J+ fF8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
; k8 c5 g$ O. A" P4 B1 s$ X: Q2 W- P! G. R- H2 R
新闻稿没讲FP精度,FP8的可能性比较大: P2 t2 {7 S/ ?4 x' V0 }
也即单机柜算力很可能比490高一点! J, M: g9 C" O( V0 `' I& _) S
% M8 D/ j( t- J8 I# ]# G
目前还是小学六年级小朋友,不能和博士比
* r( b/ t6 K3 p! q1 u$ c不在现在,在于全自主,未来可期! |
|