|
发表于 2024-8-30 21:11:23
|
显示全部楼层
. k0 I& n- M3 Q, T
有型号了,未来潜力还是巨大的
" R d, O2 Q2 V& r3 n v9 I目前算力不具备商业竞争力1 N$ c, H2 E( x4 O, v. _3 b
" A' E) m7 m& C. \) F- h一张RTX 4090 在不同精度下的理论计算性能如下:" U' Q0 U+ b' [2 ]+ H) s8 \
3 \! V/ ^9 l) b. {) v* b# e( W0 q# wFP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。) ]( P! n, f, x$ V8 y: n0 F
\( i" G/ h- p7 o/ t% z T
FP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。
' d, L4 f3 T$ a. _% w: W, \0 N8 _2 Q
F8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。
$ [9 M4 q* R; I! m* u3 ~1 X! o) Y* l; T6 Q. C6 |
新闻稿没讲FP精度,FP8的可能性比较大
7 m$ Z! ~7 ^5 z1 ^+ q4 M也即单机柜算力很可能比490高一点
) v7 U& d( g% n5 t2 e, v4 r( u1 a ~' }( B
目前还是小学六年级小朋友,不能和博士比
. O- X5 Q5 m A6 |" Q* C& s不在现在,在于全自主,未来可期! |
|