STEM版,合并数学,物理,化学,科学,工程,机械。不包括生物、医学相关,和计算机相关内容。
	版主: verdelite, TheMatrix
			
	                                        			
		
		
			- 
				
								verdelite(众傻之傻)							
 
						- 论坛元老

 			
- 帖子互动: 1103
 
		- 帖子: 25032
 		- 注册时间: 2022年 7月 21日 23:33
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 verdelite(众傻之傻) » 
			
			
			
			
			
			Caravel 写了: 2025年 9月 5日 14:09
不要尾数,误差会不会很大?
 
尾数各个bit贡献递减,不如把省下的存储和计算力用于增加神经单元数或者连接数。
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
								jiml							
 
						- 自助冻结

 			
- 帖子互动: 483
 
		- 帖子: 4300
 		- 注册时间: 2023年 2月 22日 22:50
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 jiml » 
			
			
			
			
			
			ue8m0 做推理不会有问题的
做训练够不够,是 deepseek 需要做的事,
可能已经论证过了 。
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			
								弃婴千枝							 
						- 论坛元老

 			
- 帖子互动: 1516
 
		- 帖子: 13950
 		- 注册时间: 2022年 7月 27日 10:51
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 弃婴千枝 » 
			
			
			
			
			
			Caravel 写了: 2025年 9月 5日 14:09
不要尾数,误差会不会很大?
 
因为党妈的显卡只用来推理,所以8位就可以了
而美帝N记的显卡还用来数值运算,所以仍然需要32位
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                
                                    			
		
		
			- 
				
																			
								Caravel楼主							 
						- 论坛元老

Caravel 的博客 			
- 帖子互动: 707
 
		- 帖子: 27803
 		- 注册时间: 2022年 7月 24日 17:21
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 Caravel楼主 » 
			
			
			
			
			
			jiml 写了: 2025年 9月 5日 14:17
ue8m0 做推理不会有问题的
做训练够不够,是 deepseek 需要做的事,
可能已经论证过了 。
 
会损失性能吧
感觉这就是邪路
老是想小米加步枪跟人家飞机大炮对决
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
								jiml							
 
						- 自助冻结

 			
- 帖子互动: 483
 
		- 帖子: 4300
 		- 注册时间: 2023年 2月 22日 22:50
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 jiml » 
			
			
			
			
			
			Caravel 写了: 2025年 9月 5日 14:28
会损失性能吧
感觉这就是邪路
老是想小米加步枪跟人家飞机大炮对决
 
性能,或者说算力,ue8m0 更好些.
因为,ue8m0 的 gate count 小,同等面积的 chip die,可以塞进更多的ue8m0 计算单元。
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			
								Caravel楼主							 
						- 论坛元老

Caravel 的博客 			
- 帖子互动: 707
 
		- 帖子: 27803
 		- 注册时间: 2022年 7月 24日 17:21
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 Caravel楼主 » 
			
			
			
			
			
			jiml 写了: 2025年 9月 5日 14:35
性能,或者说算力,ue8m0 更好些.
因为,ue8m0 的 gate count 小,同等面积的 chip die,可以塞进更多的ue8m0 计算单元。
 
速度快,不准也没有用
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
								pseudo(small man)							
 
						- 论坛点评

pseudo 的博客 			
- 帖子互动: 153
 
		- 帖子: 2743
 		- 注册时间: 2022年 7月 28日 10:04
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 pseudo(small man) » 
			
			
			
			
			
			Caravel 写了: 2025年 9月 5日 14:09
不要尾数,误差会不会很大?
 
把数值表达到正确的数量级上,误差随着数值大小指数比例变化,应该正好。
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			
								苍井吱(苍井吱吱)							 
						- 论坛点评

 			
- 帖子互动: 252
 
		- 帖子: 2503
 		- 注册时间: 2024年 6月 17日 15:27
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 苍井吱(苍井吱吱) » 
			
			
			
			
			
			
			
			
			
						
						
							2021年度十大优秀网友
2028年度优秀版主
按摩店前股东
脑特残的荣誉爹地
 			
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
								牛河梁(别问我是谁)							
 
						- 论坛元老

2023年度十大优秀网友
2024年度优秀版主
牛河梁 的博客 			
- 帖子互动: 1941
 
		- 帖子: 31326
 		- 注册时间: 2022年 11月 17日 21:21
 		
		
											
							- 
				联系:
				
			
 
				
		
		
						
					
													
							
						
									
						帖子
					
								由 牛河梁(别问我是谁) » 
			
			
			
			
			
			
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
								jiml							
 
						- 自助冻结

 			
- 帖子互动: 483
 
		- 帖子: 4300
 		- 注册时间: 2023年 2月 22日 22:50
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 jiml » 
			
			
			
			
			
			Caravel 写了: 2025年 9月 5日 15:35
速度快,不准也没有用
 
不见得,有些人体感觉也是 用对数测度的
比如
音量(分贝dB)使用对数尺度衡量的单位
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
	                                        			
		
		
			- 
				
								TheMatrix							
 
						- 论坛支柱

2024年度优秀版主
TheMatrix 的博客 			
- 帖子互动: 292
 
		- 帖子: 13864
 		- 注册时间: 2022年 7月 26日 00:35
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 TheMatrix » 
			
			
			
			
			
			UE8M0,这个符号似乎有点误导。实际上它就是一个整数,你可以说它就是uint8,也可以说它是int8,就是一个8位的小整数,可以是unsigned,也可以说是signed,因为它还有一个bias,一般固定为-127,这实际上就是signed int。它表示的就是,2的多少次幂可以把一个tensor scale到一个数值大小合适的区间。
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
								jiml							
 
						- 自助冻结

 			
- 帖子互动: 483
 
		- 帖子: 4300
 		- 注册时间: 2023年 2月 22日 22:50
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 jiml » 
			
			
			
			
			
			TheMatrix 写了: 2025年 9月 8日 11:01
UE8M0,这个符号似乎有点误导。实际上它就是一个整数,你可以说它就是uint8,也可以说它是int8,就是一个8位的小整数,可以是unsigned,也可以说是signed,因为它还有一个bias,一般固定为-127,这实际上就是signed int。它表示的就是,2的多少次幂可以把一个tensor scale到一个数值大小合适的区间。
 
你理解错了
2的幂,正数
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                        
                            			
	                                        			
		
		
			- 
				
																			
								windy(文帝)							 
						- 著名点评

 			
- 帖子互动: 1036
 
		- 帖子: 5227
 		- 注册时间: 2023年 2月 7日 18:53
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 windy(文帝) » 
			
			
			
			
			
			净他妈不懂装懂扯JB蛋。N显卡支持多种FP精度,从FP8到FP64都支持。FP8支持两种制式。
弃婴千枝 写了: 2025年 9月 5日 14:22
因为党妈的显卡只用来推理,所以8位就可以了
而美帝N记的显卡还用来数值运算,所以仍然需要32位
 
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			
								windy(文帝)							 
						- 著名点评

 			
- 帖子互动: 1036
 
		- 帖子: 5227
 		- 注册时间: 2023年 2月 7日 18:53
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 windy(文帝) » 
			
			
			
			
			
			U表示unsigned,不能表示负数。Bias是对指数的bias.比如如果bias是-127,如果是0的话就是2^-127. 全是1的话就是2128.任何两个2的指数之间就近似到其中一个。比如76就近似到64. 0.2就近似到0.25.
TheMatrix 写了: 2025年 9月 8日 11:01
UE8M0,这个符号似乎有点误导。实际上它就是一个整数,你可以说它就是uint8,也可以说它是int8,就是一个8位的小整数,可以是unsigned,也可以说是signed,因为它还有一个bias,一般固定为-127,这实际上就是signed int。它表示的就是,2的多少次幂可以把一个tensor scale到一个数值大小合适的区间。
 
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                
                    			
		
		
			- 
				
								jiml							
 
						- 自助冻结

 			
- 帖子互动: 483
 
		- 帖子: 4300
 		- 注册时间: 2023年 2月 22日 22:50
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 jiml » 
			
			
			
			
			
			windy 写了: 2025年 9月 8日 17:50
净他妈不懂装懂扯JB蛋。N显卡支持多种FP精度,从FP8到FP64都支持。FP8支持两种制式。
 
你并没比弃婴懂得更多
你仔细看看去,普通 N 卡,比如 5070, 是否真正地支持 fp64?
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			
								windy(文帝)							 
						- 著名点评

 			
- 帖子互动: 1036
 
		- 帖子: 5227
 		- 注册时间: 2023年 2月 7日 18:53
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 windy(文帝) » 
			
			
			
			
			
			其实这也是一个研究方向。现在的E4M3, E5M2,还有这个UE8M0都有自己的问题,以前的IEEE754就更不用说了,太古老的东西。我这次参加学术会议,一个老头就搞这个研究的。他提出了一个标准,似乎比这几个都强。就是不知道有没有硬件公司能用。
 
			
			
			
						
						
										
						 
		 
				
		
		 
	 
	                                        			
		
		
			- 
				
																			
								windy(文帝)							 
						- 著名点评

 			
- 帖子互动: 1036
 
		- 帖子: 5227
 		- 注册时间: 2023年 2月 7日 18:53
 		
		
						
						
		
		
						
					
													
							
						
									
						帖子
					
								由 windy(文帝) » 
			
			
			
			
			
			我说的是Nvidia H100之类机器学习用的高级显卡。5070当然支持FP64,也支持FP8,甚至支持FP4, 虽然是在Tensor core里
jiml 写了: 2025年 9月 8日 17:59
你并没比弃婴懂得更多
你仔细看看去,普通 N 卡,比如 5070, 是否真正地支持 fp64?
 
 
			
			
			
										
					上次由 
windy 在 2025年 9月 8日 18:04 修改。