|
发表于 2024-8-30 21:11:23
|
显示全部楼层
# R( h A+ v' K& P4 `( b/ c4 s
有型号了,未来潜力还是巨大的
* ]5 M8 o4 O' u目前算力不具备商业竞争力4 v- L2 C. [' A( o! M+ U( {7 I7 ~
0 L0 E: R+ D- C一张RTX 4090 在不同精度下的理论计算性能如下:% p E" u% r) ]7 C+ R$ z9 m; V% F
- n u7 J8 E" lFP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。0 p/ p0 i0 b' t" u7 w% ~% ?; c
1 h" a6 c+ z0 O R6 H! p7 AFP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。9 u: B9 s" G O1 d Y' ^
8 P/ A4 |$ v* c
F8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。% G9 n0 O" k0 M
, k$ {( _7 u6 i( v& T2 x' j( g新闻稿没讲FP精度,FP8的可能性比较大
% y5 {4 ^! V) n也即单机柜算力很可能比490高一点1 q9 _, v" E1 k% y, V% J& ~& e& C
' F8 b" n3 O8 f w* _9 \" \! _0 V2 f6 {
目前还是小学六年级小朋友,不能和博士比
6 M+ G; \) k7 p% q3 y, r不在现在,在于全自主,未来可期! |
|