分页: 1 / 1

#1 NVIDIA Project DIGITS GB10 DGX-mini

发表于 : 2025年 1月 7日 11:53
magagop
Project DIGITS will be available in May 2025 from NVIDIA and top partners, starting at $3,000.

The GB10 Superchip is a system-on-a-chip (SoC) based on the NVIDIA Grace Blackwell architecture and delivers up to 1 petaflop of AI performance at FP4 precision.

GB10 features an NVIDIA Blackwell GPU with latest-generation CUDA® cores and fifth-generation Tensor Cores, connected via NVLink®-C2C chip-to-chip interconnect to a high-performance NVIDIA Grace™ CPU, which includes 20 power-efficient cores built with the Arm architecture. MediaTek, a market leader in Arm-based SoC designs, collaborated on the design of GB10, contributing to its best-in-class power efficiency, performance and connectivity.

The GB10 Superchip enables Project DIGITS to deliver powerful performance using only a standard electrical outlet. Each Project DIGITS features 128GB of unified, coherent memory and up to 4TB of NVMe storage. With the supercomputer, developers can run up to 200-billion-parameter large language models to supercharge AI innovation. In addition, using NVIDIA ConnectX® networking, two Project DIGITS AI supercomputers can be linked to run up to 405-billion-parameter models.

這個是Mac Studio的有力競爭對手啊,比M4更強大。

#2 Re: NVIDIA Project DIGITS GB10 DGX-mini

发表于 : 2025年 1月 7日 11:56
(ヅ)
3000起价,lz先上好了

#3 Re: NVIDIA Project DIGITS GB10 DGX-mini

发表于 : 2025年 1月 7日 12:06
magagop
(ヅ) 写了: 2025年 1月 7日 11:56 3000起价,lz先上好了
Mac Studio 128GB的價格也差不多,會更貴,$4000

#4 Re: NVIDIA Project DIGITS GB10 DGX-mini

发表于 : 2025年 1月 7日 22:59
huangchong
viewtopic.php?f=6&t=679686

今天听说了这个东西,看了一下,似乎是GB200的缩小版。。

到处看到号称1PFLOPs, 但是这是指FP4。 没找到它的具体FP32性能参数。

用GB200的性能猜猜它的FP32大概什么速度(因为我只对游戏卡有多快有概念):

GB200(2x blasckwell GPU),20/40PFLOPs(FP4), 180TFLOPs(FP32)
https://resources.nvidia.com/en-us-blac ... id=no-ncid

那按比例缩一下,似乎GB10应该是9或4.5TFLOPs FP32。


4090是80TFLOPs FP32。难怪一个400多瓦, 一个可以放小盒子里。
4070,接近30TFLOPs, 200W。(USD500)


GB10 好处是通用内存特大,所以对于专玩LLM的人可能很有用吧。









这个人说内存是固定在chip上的,我觉得他说错了。那128GBDDR5 应该还是跟显卡的显存一样,围着GPU/CPU焊上去的。这个175秒处的动画也显示主芯片上只有GPU CPU 内存控制器,缓存。 所以我猜,那128GB内存全在旁边一圈,而且是CPU/GPU共享的。当然跑大型神经网络的时候有高达100多G的显存上限还是挺好的。

#5 Re: NVIDIA Project DIGITS GB10 DGX-mini

发表于 : 2025年 1月 7日 23:49
(ヅ)
huangchong 写了: 2025年 1月 7日 22:59 viewtopic.php?f=6&t=679686

今天听说了这个东西,看了一下,似乎是GB200的缩小版。。

到处看到号称1PFLOPs, 但是这是指FP4。 没找到它的具体FP32性能参数。

用GB200的性能猜猜它的FP32大概什么速度(因为我只对游戏卡有多快有概念):

GB200(2x blasckwell GPU),20/40PFLOPs(FP4), 180TFLOPs(FP32)
https://resources.nvidia.com/en-us-blac ... id=no-ncid

那按比例缩一下,似乎GB10应该是9或4.5TFLOPs FP32。


4090是80TFLOPs FP32。难怪一个400多瓦, 一个可以放小盒子里。
4070,接近30TFLOPs, 200W。(USD500)


GB10 好处是通用内存特大,所以对于专玩LLM的人可能很有用吧。









这个人说内存是固定在chip上的,我觉得他说错了。那128GBDDR5 应该还是跟显卡的显存一样,围着GPU/CPU焊上去的。这个175秒处的动画也显示主芯片上只有GPU CPU 内存控制器,缓存。 所以我猜,那128GB内存全在旁边一圈,而且是CPU/GPU共享的。当然跑大型神经网络的时候有高达100多G的显存上限还是挺好的。
也许是跟apple m1234那种封装呢

https://en.wikipedia.org/wiki/Apple_M1# ... 1_chip.jpg

#6 Re: NVIDIA Project DIGITS GB10 DGX-mini

发表于 : 2025年 1月 8日 00:05
huangchong
(ヅ) 写了: 2025年 1月 7日 23:49 也许是跟apple m1234那种封装呢

https://en.wikipedia.org/wiki/Apple_M1# ... 1_chip.jpg
3:10左右的动画,看上去主芯片的板子以及外壳跟那圈内存是分开的

#7 Re: NVIDIA Project DIGITS GB10 DGX-mini

发表于 : 2025年 1月 8日 00:07
(ヅ)
huangchong 写了: 2025年 1月 8日 00:05 3:10左右的动画,看上去主芯片的板子以及外壳跟那圈内存是分开的
那就是跟主机一样设计了

主机这种unified RAM/VRAM设计都好几代了