這算什麼群毆,有本事舉一塊「我是五毛」的牌子去白宮前面遊行示威,看看誰被群毆。
让叔瞅瞅你。。。(请版主锁帖)
版主: kazaawang, wh
#34 Re: 来来来,magagop,让叔瞅瞅你是否真的做 ai 芯片
你不懂,没有关系,叔可以教你
叔左脚指夹一个木棍就能在沙滩上设计整个 mips。解释 UE8M0,轻轻松松的,不涉及任何 NDA, 想不想听?
#36 Re: 来来来,magagop,让叔瞅瞅你是否真的做 ai 芯片
設計毛線MIPS,GPU裡面沒有branch,跟MIPS有什麼關係?你敢在公共論壇發帖講細節,說明你根本沒仔細閱讀NDA,我簽的NDA有小字上百頁,句句都能要命。而且FP8有什麼值得炫耀的,DeepSeek能拿到N3P的份額嗎?
#40 Re: 来来来,magagop,让叔瞅瞅你是否真的做 ai 芯片
magagop 写了: 2025年 9月 4日 16:35設計毛線MIPS,GPU裡面沒有branch,跟MIPS有什麼關係?你敢在公共論壇發帖講細節,說明你根本沒仔細閱讀NDA,我簽的NDA有小字上百頁,句句都能要命。而且FP8有什麼值得炫耀的,DeepSeek能拿到N3P的份額嗎?
UE8M0 是 8 位浮点数的一种数据格式,是 GPU 或 是 CPU,不搭界的
你不懂没关系的,你想不想听为何 deepseek 选择这个数据格式?
#41 Re: 来来来,让叔瞅瞅你是否真的做 ai 芯片
(叔会在这个楼给各位解释为何 deepseek 选择 UE8M0 这个数据格式)
在浮点格式中,符号、指数和尾数(或有效数字)是定义实数的三个组成部分,例如
E4M3: 由 1 位符号位、4 位指数位和 3 位尾数组成
UE8M0:它将所有 8 位分配给指数,尾数和符号位留零。没有符号位,所以只能表示非负数。没有尾数,UE8M0 表示的任何数字都是 2 的幂。
ai 的基本运算是矩阵相乘,矩阵里的数字,最初是 32 位浮点数,到现在是 8 位浮点数 ,明年就会是最先进的 4 位浮点数了。
今天我讲的是 8 位浮点数(fp8) 矩阵相乘,一行和一列对应的 fp8 相乘后加一起,所有行与所有列,都乘一遍,计算量巨大。
两个 E4M3 浮点数相乘是这么做的:
指数加指数
尾数乘尾数
符号乘符号
这其中,尾数乘尾数要用到乘法器,乘法器比加法器大很多,费 gates,费电。
两个 UE8M0 浮点数相乘是这么做的:
指数加指数
that's it,通过用 UE8M0,deepseek 把复杂的 fp 8 浮点运算简化成两个 8 位无符号整数相加,省 gates ,符合中国半导体产业的国情
(完)

#43 Re: 来来来,magagop,让叔瞅瞅你是否真的做 ai 芯片
jiml 写了: 2025年 9月 4日 16:53UE8M0 是 8 位浮点数的一种数据格式,是 GPU 或 是 CPU,不搭界的
你不懂没关系的,你想不想听
为何 deepseek 选择这个数据格式?
DeepSeek選擇哪個格式跟我有什麼關係?反正我只能說,FP6、FP4各種奇葩格式我們都測過了,結果很多,沒有業內統一標準。FP8是上一代產品,就不用拿出來炫耀了。一個芯片公司的研發pipeline一般提前五年,等你們公開討論的時候,芯片都要production了。
#44 Re: 来来来,让叔瞅瞅你是否真的做 ai 芯片
jiml 写了: 2025年 9月 4日 16:55(叔会在这个楼给各位解释为何 deepseek 选择 UE8M0 这个数据格式)
在浮点格式中,符号、指数和尾数(或有效数字)是定义实数的三个组成部分,例如
E4M3: 由 1 位符号位、4 位指数位和 3 位尾数组成
UE8M0:它将所有 8 位分配给指数,尾数和符号位留零。没有符号位,所以只能表示非负数。没有尾数,UE8M0 表示的任何数字都是 2 的幂。
ai 的基本运算是矩阵相乘,矩阵里的数字,最初是 32 位浮点数,到现在是 8 位浮点数 ,明年就会是最先进的 4 位浮点数了。
今天我讲的是 8 位浮点数(fp8) 矩阵相乘,一行和一列对应的 fp8 相乘后加一起,所有行与所有列,都乘一遍,计算量巨大。
就這?面向小白的科普文嗎?我說了,DeepSeek不是芯片公司,不值得出來炫耀。凡是敢出來討論細節的,都不是芯片公司員工,不知道NDA的厲害。
#46 Re: 来来来,让叔瞅瞅你是否真的做 ai 芯片
叔在上面解释了为何 deepseek 选择 UE8M0 这个数据格式
有问题请举手问
被班主擦黑板擦掉的那个谁,他是不是懂 ai,各位看客自然会有判断。不需要再吵了