|
发表于 2024-8-30 21:11:23
|
显示全部楼层
" a+ ], g( P. ]- P; R有型号了,未来潜力还是巨大的9 U2 r. {. K3 R0 Y$ y; U
目前算力不具备商业竞争力
0 Y$ g5 m6 w1 e* l# X8 t2 v) [2 b4 _
一张RTX 4090 在不同精度下的理论计算性能如下:
& b; y( p6 U8 ~7 z) J F8 U. U% }( {+ ~
6 P5 x" Z: Z' @, j" rFP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。
/ J( [6 I9 I: E+ F2 q" ^* e5 M) S' m5 r: p' `% U. P' g' u
FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。
; ^; `% x& L+ u! E2 I5 H# L1 r! ?% b' K5 @7 ^' E w N
F8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
6 p( Z# e3 {' w7 u
1 |7 y* Q- x1 Y新闻稿没讲FP精度,FP8的可能性比较大1 ~ \# m- j" u; w9 U
也即单机柜算力很可能比490高一点
, {6 y, D/ v5 c
' e& r2 @' d, z3 Y/ w1 |目前还是小学六年级小朋友,不能和博士比
$ ~8 V9 N# C5 C不在现在,在于全自主,未来可期! |
|