|
发表于 2024-8-30 21:11:23
|
显示全部楼层
( h2 g! D8 N9 x2 s( N" h; ]; L/ n有型号了,未来潜力还是巨大的1 d8 I4 M* Y! A5 _
目前算力不具备商业竞争力
/ P; z# A6 y& J5 Z8 p7 g! x8 ?- m
6 S9 H. e% B" J& l1 Y一张RTX 4090 在不同精度下的理论计算性能如下:$ I. T4 _, C# @$ `) x4 z6 K6 g" [2 O
8 ?% z" m1 P8 c: E5 w: b( K
FP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。
8 D1 W D' Q8 k! t- e
3 }4 Q1 g( G( ?7 j3 \1 C" B' I8 fFP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。
( r4 ~/ `# Q, l
( Z2 o! d2 Q5 F+ y1 H( TF8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
3 H9 L% J7 L; G9 f: i' O! M+ O9 E9 n* X, m L/ F
新闻稿没讲FP精度,FP8的可能性比较大
1 O- r* N2 }6 r也即单机柜算力很可能比490高一点
: q% C. f/ a1 W1 E: u) X
% d$ Q8 @* t* D- i/ G目前还是小学六年级小朋友,不能和博士比+ C- w6 [/ t5 G' ]7 i% _
不在现在,在于全自主,未来可期! |
|