|
|
发表于 2024-8-30 21:11:23
|
显示全部楼层
+ g+ n5 Z! k/ W9 P# n" ?' r有型号了,未来潜力还是巨大的
; Z5 A4 g) v6 d. z( ?9 j1 n; {目前算力不具备商业竞争力( w1 f* N0 j7 r; ?' ^4 q; r
' A3 ]7 ^; u4 _+ @9 r8 E
一张RTX 4090 在不同精度下的理论计算性能如下:
2 l' S7 I; ^& e$ i' h
0 q' _ j& e1 p- \' p7 NFP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。
3 k3 N. M$ s! N7 J
# u1 ^9 P5 w. |7 TFP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。3 b5 N& }3 a( f
/ a* n/ Z' ~0 |3 p6 F, g% o
F8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。* ?+ Q+ N, Z$ M
9 f3 a6 t; A, R/ h1 T+ O新闻稿没讲FP精度,FP8的可能性比较大( h0 `5 k4 I/ @, m
也即单机柜算力很可能比490高一点
. j2 }3 i, c" Q! M0 T
% n) G7 w8 L) Q9 Q目前还是小学六年级小朋友,不能和博士比, N! ?3 c. i9 D7 V
不在现在,在于全自主,未来可期! |
|