刚试了一下,我的4080的显卡(16G显存),
跑Mistral-small 22b能到45tokens, 24b到14 tokens. 前者非常可用,后者可用。
DS-R1 14b: 60 tokens.
DS-R1 32b: 4 tokens.
后者慢了一点。
Mistral-small的模型似乎大一点,不知道效果和DS-R1比如何。比如 22b vs 14b, 24b vs 14b.
Mistral-small和DS小模型版本比如何?
版主: Jack12345
#4 Re: Mistral-small和DS小模型版本比如何?
我用3090跑,速度可以接受,答案简洁,正确率高windy 写了: 2025年 1月 31日 13:29 刚试了一下,我的4080的显卡(16G显存),
跑Mistral-small 22b能到45tokens, 24b到14 tokens. 前者非常可用,后者可用。
DS-R1 14b: 60 tokens.
DS-R1 32b: 4 tokens.
后者慢了一点。
Mistral-small的模型似乎大一点,不知道效果和DS-R1比如何。比如 22b vs 14b, 24b vs 14b.
#8 Re: Mistral-small和DS小模型版本比如何?
22b我还没玩过。
刚才忘说了,用3060/12G跑 mistral24b的时候,能把30层网络放在vram里,剩下的得在cpu里算,刚测了一下大概一秒7token左右, 不过好在mistral废话不多