|
|
发表于 2024-8-30 21:11:23
|
显示全部楼层
$ H7 w4 O6 h @/ N! b; h0 C有型号了,未来潜力还是巨大的( L8 y! C- d' ~2 @
目前算力不具备商业竞争力6 h6 U) N" p0 p" q, b, g- A5 W
1 \8 r6 a8 o) c5 ]# p0 X
一张RTX 4090 在不同精度下的理论计算性能如下: f" r& M, M/ ~7 f; O
+ L6 a; S9 ~0 ~2 }FP32(单精度浮点运算):约 82.6 TFLOPS。这是通常用于高性能计算和图形渲染的精度。
. q% T1 W- F4 ~1 k
- r' O! M1 Z! x" r$ n/ |0 VFP16(半精度浮点运算): FP16 性能可以达到 FP32 性能的两倍,即约 165.2 TFLOPS。) a9 Z0 t5 c7 H
! v6 `/ S! Q/ R4 H* T* F9 fF8(INT8 整数运算):RTX 4090 在 INT8 模式下的性能可以更高,通常用于深度学习推理,以提高吞吐量。其性能可以达到 FP32 性能的四倍,即约 330.4 TOPS(万亿次操作每秒)。$ x) }6 O) @( O, I
# B5 Q- }$ [/ B! A1 I+ ?# R3 f( p新闻稿没讲FP精度,FP8的可能性比较大
* Y! s7 h/ L% W) P( `9 P& J也即单机柜算力很可能比490高一点
# N3 R7 I+ w6 M8 G# g: N* {- T
# S; t5 k% }' A0 ^目前还是小学六年级小朋友,不能和博士比 j0 o) L7 `$ W. l: `9 D
不在现在,在于全自主,未来可期! |
|