（转载）业界更喜欢qwen模型

Caravel · 帖子由 **Caravel楼主** » 2025年 10月 24日 00:36

此帖转自 Caravel 在军事天地（Military）的帖子：业界更喜欢qwen模型

windy

他说的很清楚，Qwen便宜，快，足够好。OpenAI其实更好，但太贵。所以从利润角度，大部分用Qwen.

Caravel · 帖子由 **Caravel楼主** » 2025年 10月 24日 10:24

windy 写了： 2025年 10月 24日 07:33
他说的很清楚，Qwen便宜，快，足够好。OpenAI其实更好，但太贵。所以从利润角度，大部分用Qwen.

他们用来做客服，token量很大

pathdream

炒币世界第一

https://nof1.ai/

wokao · 帖子由 **wokao** » 2025年 10月 24日 12:16

qwen不比Gemini pro差多少
我都是两个同时用
区别是qwen比较直率，我说错了，它直接说我错了。

Caravel 写了： 2025年 10月 24日 00:36
此帖转自 Caravel 在军事天地（Military）的帖子：业界更喜欢qwen模型

fantasist · 帖子由 **fantasist** » 2025年 10月 24日 12:26

阿里做事非常solid。qwen3 training和inference成本低，实际效果比DS好，虽然PR做不过他们。

Caravel · 帖子由 **Caravel楼主** » 2025年 10月 24日 12:43

fantasist 写了： 2025年 10月 24日 12:26
阿里做事非常solid。qwen3 training和inference成本低，实际效果比DS好，虽然PR做不过他们。

DS也很牛逼，国内现在新一代模型基本都仿照了DS V3的架构，水平提升了一大截。但是他们模型太大，用起来不方便。

fantasist · 帖子由 **fantasist** » 2025年 10月 24日 13:45

Caravel 写了： 2025年 10月 24日 12:43
DS也很牛逼，国内现在新一代模型基本都仿照了DS V3的架构，水平提升了一大截。但是他们模型太大，用起来不方便。

kimi-k2这个1T的模型我们试了一下，training太勉强，inference cost根本不划算。qwen3 235B是一个sweet spot。

anesthetic · 帖子由 **anesthetic** » 2025年 10月 24日 13:55

这不很正常吗，qwen一直都霸榜hugging。。。

anesthetic · 帖子由 **anesthetic** » 2025年 10月 24日 13:59

最牛x的是qwen coder, 平时20人做3个月的project直接写好spec扔给qwen coder，一周就跑出来了，相比codex Claude就是垃圾（太贵）。

wildthing · 帖子由 **wildthing** » 2025年 10月 24日 15:13

fantasist 写了： 2025年 10月 24日 13:45
kimi-k2这个1T的模型我们试了一下，training太勉强，inference cost根本不划算。qwen3 235B是一个sweet spot。

qwen3 235B 需要几个H-100才跑的动？

fantasist · 帖子由 **fantasist** » 2025年 10月 24日 15:29

wildthing 写了： 2025年 10月 24日 15:13
qwen3 235B 需要几个H-100才跑的动？

一般都是以整台8卡机器为单位，大规模serving主要研究怎么加速，比如做pd分离。个人量化到极限然后用最少的卡跑着玩，需要多少显存是可以计算的。还有cpu offloading之类牺牲速度换低显存需求的办法。
墙国好像能把4090魔改成48GB显存，这样消费级显卡也能跑，所以美帝禁售到这个级别。

赖美豪中

他只是不想得罪altman而已，openai现在是最烂的大模型。

windy 写了： 2025年 10月 24日 07:33
他说的很清楚，Qwen便宜，快，足够好。OpenAI其实更好，但太贵。所以从利润角度，大部分用Qwen.

wildthing · 帖子由 **wildthing** » 2025年 10月 24日 15:42

fantasist 写了： 2025年 10月 24日 15:29
一般都是以整台8卡机器为单位，大规模serving主要研究怎么加速，比如做pd分离。个人量化到极限然后用最少的卡跑着玩，需要多少显存是可以计算的。还有cpu offloading之类牺牲速度换低显存需求的办法。
墙国好像能把4090魔改成48GB显存，这样消费级显卡也能跑，所以美帝禁售到这个级别。

你们用这个怎么挣钱啊？

fantasist · 帖子由 **fantasist** » 2025年 10月 24日 15:49

wildthing 写了： 2025年 10月 24日 15:42
你们用这个怎么挣钱啊？

我现在这个startup目前还是以user growth为主。
想一开始就挣钱的话，就是另一种创业思路了。

pnlmpnlm

anesthetic 写了： 2025年 10月 24日 13:59
最牛x的是qwen coder, 平时20人做3个月的project直接写好spec扔给qwen coder，一周就跑出来了，相比codex Claude就是垃圾（太贵）。

真的假的，我一直用claude，主要也不是我掏钱公司给出钱我也没在乎。但是如果qwen coder那么好用还能离线，不用它干嘛。

Caravel · 帖子由 **Caravel楼主** » 2025年 10月 24日 17:51

anesthetic 写了： 2025年 10月 24日 13:59
最牛x的是qwen coder, 平时20人做3个月的project直接写好spec扔给qwen coder，一周就跑出来了，相比codex Claude就是垃圾（太贵）。

这么厉害？从来没听别人说过

hci

Qwen 与codex的能力差距还是很大的。前者不能用来啃硬骨头，也就是复杂代码的修改和调试，后者可以。

Caravel 写了： 2025年 10月 24日 17:51
这么厉害？从来没听别人说过

wmysh

我给家里年长的老人都装了通义千问。
手机界面支持语音提示。小辈不在身边的时候，帮着回答些日常问题很方便。

anesthetic · 帖子由 **anesthetic** » 2025年 10月 24日 22:39

hci 写了： 2025年 10月 24日 18:06
Qwen 与codex的能力差距还是很大的。前者不能用来啃硬骨头，也就是复杂代码的修改和调试，后者可以。

qwen确实不适合读屎山代码，新项目完全木有问题，3天可以干出个8成功力的tiktok

新未名空间

（转载）业界更喜欢qwen模型

#1 （转载）业界更喜欢qwen模型

#2 Re: （转载）业界更喜欢qwen模型

#3 Re: （转载）业界更喜欢qwen模型

#4 Re: （转载）业界更喜欢qwen模型

#5 Re: （转载）业界更喜欢qwen模型

#6 Re: （转载）业界更喜欢qwen模型

#7 Re: （转载）业界更喜欢qwen模型

#8 Re: （转载）业界更喜欢qwen模型

#9 Re: （转载）业界更喜欢qwen模型

#10 Re: （转载）业界更喜欢qwen模型

#11 Re: （转载）业界更喜欢qwen模型

#12 Re: （转载）业界更喜欢qwen模型

#13 Re: （转载）业界更喜欢qwen模型

#14 Re: （转载）业界更喜欢qwen模型

#15 Re: （转载）业界更喜欢qwen模型

#16 Re: （转载）业界更喜欢qwen模型

#17 Re: （转载）业界更喜欢qwen模型

#18 Re: （转载）业界更喜欢qwen模型

#19 Re: （转载）业界更喜欢qwen模型

#20 Re: （转载）业界更喜欢qwen模型