自己玩DSR1我建议弄14b参数的模型

STEM版,合并数学,物理,化学,科学,工程,机械。不包括生物、医学相关,和计算机相关内容。

版主: verdeliteTheMatrix

头像
(ヅ)楼主
论坛支柱
论坛支柱
帖子互动: 549
帖子: 11819
注册时间: 2022年 8月 21日 14:20

#1 自己玩DSR1我建议弄14b参数的模型

帖子 (ヅ)楼主 »

下载是9GB

会用掉大约8-9GB显存,一般显卡都能用

gpu可比cpu快多了

2/16/25,昨天看到一个经验公式

图片

+2.00 积分 [用户 TheMatrix 给您的打赏]
x1 图片
上次由 (ヅ) 在 2025年 2月 16日 17:37 修改。

标签/Tags:
头像
DIYer
著名点评
著名点评
帖子互动: 269
帖子: 3705
注册时间: 2023年 11月 7日 13:48

#2 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 DIYer »

奇怪,我运行的时候GPU占用很低,输出还很快
头像
HouseMD(黄皮川黑)
著名点评
著名点评
帖子互动: 742
帖子: 5098
注册时间: 2022年 7月 28日 14:44

#3 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 HouseMD(黄皮川黑) »

DIYer 写了: 2025年 1月 28日 22:42 奇怪,我运行的时候GPU占用很低,输出还很快
有些简单的问题,他们做了优化,实际上不调用运算
图片
soric_real(soric)
论坛点评
论坛点评
帖子互动: 102
帖子: 2740
注册时间: 2022年 11月 7日 13:58

#4 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 soric_real(soric) »

我在2019 MacBook pro 16上运行14b,好像radeon 5500M的GPU完全没参与进去。
(ヅ) 写了: 2025年 1月 28日 21:38 会用掉大约8-9GB显存,一般显卡都能用

gpu可比cpu快多了
头像
(ヅ)楼主
论坛支柱
论坛支柱
帖子互动: 549
帖子: 11819
注册时间: 2022年 8月 21日 14:20

#5 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 (ヅ)楼主 »

DIYer 写了: 2025年 1月 28日 22:42 奇怪,我运行的时候GPU占用很低,输出还很快
我在笔记本上6gb显存就不行,cpu输出的,慢多了

看task manager,cpu gpu哪个用满了就是在用哪个
头像
(ヅ)楼主
论坛支柱
论坛支柱
帖子互动: 549
帖子: 11819
注册时间: 2022年 8月 21日 14:20

#6 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 (ヅ)楼主 »

soric_real 写了: 2025年 1月 29日 00:12 我在2019 MacBook pro 16上运行14b,好像radeon 5500M的GPU完全没参与进去。
也许刚刚不够

我的显存usage开始前是2gb,开始后是10gb到10.7gb
头像
(ヅ)楼主
论坛支柱
论坛支柱
帖子互动: 549
帖子: 11819
注册时间: 2022年 8月 21日 14:20

#7 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 (ヅ)楼主 »

这个东西可以直接接入vscode,替代cursor/windsurf,还蛮好用

术版有讨论怎么配置
webdriver(不折腾不舒服斯基)
见习点评
见习点评
帖子互动: 83
帖子: 1491
注册时间: 2022年 11月 11日 12:30
来自: 火星

#8 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 webdriver(不折腾不舒服斯基) »

(ヅ) 写了: 2025年 1月 29日 04:32 这个东西可以直接接入vscode,替代cursor/windsurf,还蛮好用

术版有讨论怎么配置
搞得我心痒痒的,LOL
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 4115
帖子: 61068
注册时间: 2022年 7月 22日 01:22

#9 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

DIYer 写了: 2025年 1月 28日 22:42 奇怪,我运行的时候GPU占用很低,输出还很快
你可以用nvitop(python)来记录一下显卡的活动 我每次问本地模型一个问题 它都是立刻要90%以上的活跃的 而且模型也会在显存里长期占着
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 4115
帖子: 61068
注册时间: 2022年 7月 22日 01:22

#10 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

(ヅ) 写了: 2025年 1月 29日 04:17 我在笔记本上6gb显存就不行,cpu输出的,慢多了

看task manager,cpu gpu哪个用满了就是在用哪个
lmstudio允许把模型的一部分放进显卡算 剩下在在CPU算 我记得用这个方法可以把比显存大的模型一部分在gpu上运行 不过lmstudio怎么做http服务我还没试过(估计不难 大不了自己写)
头像
StMichael
论坛点评
论坛点评
帖子互动: 93
帖子: 2365
注册时间: 2022年 7月 23日 09:43

#11 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 StMichael »

这种本地蒸馏版的可以干些啥啊?

文字处理和简单coding?
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 4115
帖子: 61068
注册时间: 2022年 7月 22日 01:22

#12 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

StMichael 写了: 2025年 1月 29日 14:38 这种本地蒸馏版的可以干些啥啊?

文字处理和简单coding?
可以分析PDF(水平有限) 分析code 写code
头像
(ヅ)楼主
论坛支柱
论坛支柱
帖子互动: 549
帖子: 11819
注册时间: 2022年 8月 21日 14:20

#13 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 (ヅ)楼主 »

huangchong 写了: 2025年 1月 29日 14:21 lmstudio允许把模型的一部分放进显卡算 剩下在在CPU算 我记得用这个方法可以把比显存大的模型一部分在gpu上运行 不过lmstudio怎么做http服务我还没试过(估计不难 大不了自己写)
会不会得不偿失

要把模型都塞进显存里面就是为了互相访问更快

这样混合模式还要通过pci-e总线
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 4115
帖子: 61068
注册时间: 2022年 7月 22日 01:22

#14 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

(ヅ) 写了: 2025年 1月 29日 14:47 会不会得不偿失

要把模型都塞进显存里面就是为了互相访问更快

这样混合模式还要通过pci-e总线
如果末端几层大小不大应该问题不太大 pcie3 一个lane是1GB/s 其实也不是太慢 只是跟显存100-300G/s比 慢太多 普通CPU内存好像其实也就20G/s左右
头像
(ヅ)楼主
论坛支柱
论坛支柱
帖子互动: 549
帖子: 11819
注册时间: 2022年 8月 21日 14:20

#15 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 (ヅ)楼主 »

huangchong 写了: 2025年 1月 29日 15:20 如果末端几层大小不大应该问题不太大 pcie3 一个lane是1GB/s 其实也不是太慢 只是跟显存100-300G/s比 慢太多 普通CPU内存好像其实也就20G/s左右
现在内存速度是100GB/s附近了, aida64可测,其实也可以根据specs算出来

图片
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 4115
帖子: 61068
注册时间: 2022年 7月 22日 01:22

#16 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

(ヅ) 写了: 2025年 1月 29日 15:21 现在内存速度是100GB/s附近了
哦 是吗 我的数字可能是两三年前看ddr4的时候的印象
头像
(ヅ)楼主
论坛支柱
论坛支柱
帖子互动: 549
帖子: 11819
注册时间: 2022年 8月 21日 14:20

#17 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 (ヅ)楼主 »

huangchong 写了: 2025年 1月 29日 15:24 哦 是吗 我的数字可能是两三年前看ddr4的时候的印象
理论计算DDR5-5200MT/s的速度83.2GB/s
图片
实测76.7GB/s


图片
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 4115
帖子: 61068
注册时间: 2022年 7月 22日 01:22

#18 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 huangchong(净坛使者) »

(ヅ) 写了: 2025年 1月 29日 15:31 理论计算DDR5-5200MT/s的速度83.2GB/s
图片
实测76.7GB/s


图片
我还以为总是mt × 8 然后乘通道数
头像
(ヅ)楼主
论坛支柱
论坛支柱
帖子互动: 549
帖子: 11819
注册时间: 2022年 8月 21日 14:20

#19 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 (ヅ)楼主 »

huangchong 写了: 2025年 1月 29日 15:39 我还以为总是mt × 8 然后乘通道数
除以8把bit换成byte,双通道ddr4/5都是128bit,ddr4是64bitx2,ddr5是32bitx2x2
头像
Pegasi
见习点评
见习点评
帖子互动: 72
帖子: 1273
注册时间: 2022年 10月 22日 12:50

#20 Re: 自己玩DSR1我建议弄14b参数的模型

帖子 Pegasi »

(ヅ) 写了: 2025年 1月 28日 21:38 下载是9GB

会用掉大约8-9GB显存,一般显卡都能用

gpu可比cpu快多了
14B 4090显存不够吧
回复

回到 “STEM”