|
发表于 2024-8-30 21:11:23
|
显示全部楼层
$ V( l7 R1 }. Q- O9 u有型号了,未来潜力还是巨大的
0 h: K4 p4 @, }/ X7 M9 a目前算力不具备商业竞争力6 p4 m6 k. z' d- ?0 ^
5 K9 P, x r! S& Q! {! S. t* T1 k- e9 ~; i一张RTX 4090 在不同精度下的理论计算性能如下:. j; E& _/ r- Q/ T
) W* _& L j+ r5 |1 @
FP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。
: U$ Z1 ~ b% Y& a" l
$ D4 p2 |, d! @FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。
F! z. P |) k1 M! p, W. g
# q5 _, @2 h' S! E- D4 aF8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
+ D* ?2 Y8 A' { Y. W' T h8 R) O0 |' U% n0 n1 h/ I" C. L
新闻稿没讲FP精度,FP8的可能性比较大2 r3 w' ]& P6 h
也即单机柜算力很可能比490高一点
' W; ^, q, H2 u7 P$ I1 Z6 k$ `4 I f' s8 \" C# L5 c% L
目前还是小学六年级小朋友,不能和博士比+ D! x* T+ T e9 r8 ?9 s9 {
不在现在,在于全自主,未来可期! |
|