完了,deepseek把GPU上的fp8的汇编代码开源了。

对应老买买提的军事天地,观点交锋比较激烈,反驳不留情面,请作好心理准备。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。


版主: Softfist

xexz楼主
论坛精英
论坛精英
帖子互动: 372
帖子: 6495
注册时间: 2022年 7月 30日 11:48
联系:

#21 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 xexz楼主 »

verdelite 写了: 2025年 2月 25日 23:11 大概是:不需要买几万刀一片的芯片了,只需要买几千一片的,用新算法也很快。
上面是个JIT虚拟机,下层用的nvGPU的汇编🐎

意思是,其他家的GPU只要实现NV的汇编🐎(这个对那些GPU硬件厂家跟没要求一样),用谁的GPU都一样一样的。
x1 图片
takeway
著名点评
著名点评
帖子互动: 126
帖子: 3872
注册时间: 2022年 8月 2日 11:36

#22 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 takeway »

一剑定清风 写了: 2025年 2月 25日 23:11 这个牛逼了,我也不太懂,为啥这个也开源
刺破自己的房产泡沫后,开始来刺美帝的AI泡沫?美帝听了谁的忽悠押宝AI和芯片,不能吃不能烧,还不能提供广大就业
x1 图片
wanmeishijie(石昊)
论坛元老
论坛元老
wanmeishijie 的博客
帖子互动: 2206
帖子: 70733
注册时间: 2022年 12月 10日 23:58

#23 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 wanmeishijie(石昊) »

takeway 写了: 2025年 2月 25日 23:22 刺破自己的房产泡沫后,开始来刺美帝的AI泡沫?美帝听了谁的忽悠押宝AI和芯片,不能吃不能烧,还不能提供广大就业
其实美帝医药这么发达,炒作长生药更合理
图片
理解了老将是代入狗的视角之后,你就理解了老将
viewtopic.php?t=120513

理解了它们是代入狗的视角之后,它们为什么会嘲笑不愿意当狗的人,以及为什么会害怕想要反抗的人,就都可以理解了:
“放着好好的狗不当” :lol:
xexz楼主
论坛精英
论坛精英
帖子互动: 372
帖子: 6495
注册时间: 2022年 7月 30日 11:48
联系:

#24 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 xexz楼主 »

xexz 写了: 2025年 2月 25日 23:21 上面是个JIT虚拟机,下层用的nvGPU的汇编🐎

意思是,其他家的GPU只要实现NV的汇编🐎(这个对那些GPU硬件厂家跟没要求一样),用谁的GPU都一样一样的。
这个JIT算deepseek的核心科技。

开源之后,会有很多GPU、NPU、LPU各种pu厂家,忙不迭的贡献这些代码,

众生平等了。 :mrgreen: :mrgreen: :mrgreen:
x1 图片
上次由 xexz 在 2025年 2月 25日 23:30 修改。
头像
verdelite
论坛元老
论坛元老
帖子互动: 1005
帖子: 23988
注册时间: 2022年 7月 21日 23:33

#25 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 verdelite »

xexz 写了: 2025年 2月 25日 23:21 上面是个JIT虚拟机,下层用的nvGPU的汇编🐎

意思是,其他家的GPU只要实现NV的汇编🐎(这个对那些GPU硬件厂家跟没要求一样),用谁的GPU都一样一样的。
我看他还是用了CUDA,别的厂家可以用吗?还是这个更容易绕过?
realbug(WA)
职业作家
职业作家
帖子互动: 63
帖子: 512
注册时间: 2022年 7月 30日 17:21

#26 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 realbug(WA) »

Ds这波操作基本上是在说,我活不活无所谓,但你一定要死。
xexz楼主
论坛精英
论坛精英
帖子互动: 372
帖子: 6495
注册时间: 2022年 7月 30日 11:48
联系:

#27 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 xexz楼主 »

verdelite 写了: 2025年 2月 25日 23:30 我看他还是用了CUDA,别的厂家可以用吗?还是这个更容易绕过?
他是一个JIT虚拟机,目前,底层是基于nvGPU汇编代码,这部分也公开了,其他厂家只要实现这些汇编就可以用这个JIT虚拟机。

这个对其他硬件厂家没难度,GPU不是cpu,指令集简单得多。甚至多核的有单指令多数据指令的CPU也能表现的很强劲(当然,cpu核心少,不是一个数量级)。 :mrgreen: :mrgreen: :mrgreen:
xexz楼主
论坛精英
论坛精英
帖子互动: 372
帖子: 6495
注册时间: 2022年 7月 30日 11:48
联系:

#28 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 xexz楼主 »

realbug 写了: 2025年 2月 25日 23:36 Ds这波操作基本上是在说,我活不活无所谓,但你一定要死。
姜文告诉周润发:“没有你很重要。”
x1 图片
buce
论坛精英
论坛精英
帖子互动: 267
帖子: 7894
注册时间: 2022年 7月 23日 21:52

#29 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 buce »

这几天AI股跌的那个惨
Miraboreasu
知名作家
知名作家
帖子互动: 43
帖子: 919
注册时间: 2023年 10月 6日 11:26

#30 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 Miraboreasu »

不懂就问 这不还是cuda.h么
happens
论坛支柱
论坛支柱
帖子互动: 320
帖子: 10130
注册时间: 2022年 8月 29日 23:38

#31 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 happens »

xexz 写了: 2025年 2月 25日 23:28 这个JIT算deepseek的核心科技。

开源之后,会有很多GPU、NPU、LPU各种pu厂家,忙不迭的贡献这些代码,

众生平等了。 :mrgreen: :mrgreen: :mrgreen:
苏妈今晚笑醒了
头像
verdelite
论坛元老
论坛元老
帖子互动: 1005
帖子: 23988
注册时间: 2022年 7月 21日 23:33

#32 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 verdelite »

xexz 写了: 2025年 2月 25日 23:39 他是一个JIT虚拟机,目前,底层是基于nvGPU汇编代码,这部分也公开了,其他厂家只要实现这些汇编就可以用这个JIT虚拟机。

这个对其他硬件厂家没难度,GPU不是cpu,指令集简单得多。甚至多核的有单指令多数据指令的CPU也能表现的很强劲(当然,cpu核心少,不是一个数量级)。 :mrgreen: :mrgreen: :mrgreen:
那我们等等看啥时候能出第一个用这些代码(或者其变种,毕竟改400行代码应该比较容易)的非NVDA芯片。
用户168
著名点评
著名点评
帖子互动: 263
帖子: 4458
注册时间: 2024年 2月 16日 21:11

#33 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 用户168 »

以后出现专门的AI芯片,才算完
midlander
论坛元老
论坛元老
帖子互动: 774
帖子: 32549
注册时间: 2022年 8月 5日 14:58

#34 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 midlander »

xexz 写了: 2025年 2月 25日 23:39 他是一个JIT虚拟机,目前,底层是基于nvGPU汇编代码,这部分也公开了,其他厂家只要实现这些汇编就可以用这个JIT虚拟机。

这个对其他硬件厂家没难度,GPU不是cpu,指令集简单得多。甚至多核的有单指令多数据指令的CPU也能表现的很强劲(当然,cpu核心少,不是一个数量级)。 :mrgreen: :mrgreen: :mrgreen:
amd不是做了适配了么?都不敢开源
Havana
论坛元老
论坛元老
帖子互动: 768
帖子: 21262
注册时间: 2022年 8月 16日 21:53

#35 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 Havana »

不急,等老将们找出里面的bug才好做结论。
xexz 写了: 2025年 2月 25日 22:42 你们快去看看吧,完了,完了,完了。。。。。。nv这回是真完了。 :mrgreen: :mrgreen: :mrgreen:
头像
verdelite
论坛元老
论坛元老
帖子互动: 1005
帖子: 23988
注册时间: 2022年 7月 21日 23:33

#36 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 verdelite »

用户168 写了: 2025年 2月 25日 23:44 以后出现专门的AI芯片,才算完
NVDA钱多人多经验丰富,它要抢先推出这样的芯片。
realbug(WA)
职业作家
职业作家
帖子互动: 63
帖子: 512
注册时间: 2022年 7月 30日 17:21

#37 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 realbug(WA) »

据说ds已经可以在华为的晟腾910B上推理了,这个想做应该不难
verdelite 写了: 2025年 2月 25日 23:43 那我们等等看啥时候能出第一个用这些代码(或者其变种,毕竟改400行代码应该比较容易)的非NVDA芯片。
用户168
著名点评
著名点评
帖子互动: 263
帖子: 4458
注册时间: 2024年 2月 16日 21:11

#38 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 用户168 »

verdelite 写了: 2025年 2月 25日 23:48 NVDA钱多人多经验丰富,它要抢先推出这样的芯片。
非常难。如果历史可以借鉴的话,就知道这事情得新公司去干。远的比如柯达发明了电子相机,但是舍不得胶卷生意,结果就失去了电子相机市场。近的INTC失去移动芯片的市场,微软老是想把windows搬得手机上也行不通。
rtyu
见习写手
见习写手
帖子互动: 11
帖子: 105
注册时间: 2022年 9月 9日 01:24

#39 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 rtyu »

为什么今天发?明天NVDA发财报。这是有目的的!
x1 图片
头像
verdelite
论坛元老
论坛元老
帖子互动: 1005
帖子: 23988
注册时间: 2022年 7月 21日 23:33

#40 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

帖子 verdelite »

rtyu 写了: 2025年 2月 25日 23:55 为什么今天发?明天NVDA发财报。这是有目的的!
梁文锋是搞金融的。。。
回复

回到 “军事天地(Military)”