新买买提,海外华人中文论坛
跳到内容
对应老买买提的军事天地,观点交锋比较激烈,反驳不留情面,请作好心理准备。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。
版主: Softfist
帖子 由 Caravel楼主 » 2025年 10月 30日 23:31
此帖转自 Caravel 在 葵花宝典(Programming) 的帖子:Windsurf发布了一个GLM finetune模型
base model还是很难训练的,一般团队搞不定
帖子 由 Caravel楼主 » 2025年 10月 30日 23:37
美国的这种小startup如果没有开源模型
就被大厂搞死了
帖子 由 pepper » 2025年 10月 30日 23:39
训练一次几千万美金几个月时间,没时间没经验真的搞不来 国内团队都是从小模型开始慢慢积累经验,我帝的公司感觉还是太浮躁
帖子 由 Caravel楼主 » 2025年 10月 30日 23:48
pepper 写了: 2025年 10月 30日 23:39 训练一次几千万美金几个月时间,没时间没经验真的搞不来 国内团队都是从小模型开始慢慢积累经验,我帝的公司感觉还是太浮躁
最近中国好几个公司感觉开窍了一样
帖子 由 pepper » 昨天 00:23
Caravel 写了: 2025年 10月 30日 23:48 最近中国好几个公司感觉开窍了一样
Deepseek把路走通了
帖子 由 Caravel楼主 » 昨天 00:26
pepper 写了: 昨天 00:23 Deepseek把路走通了
开源这个生态其实很好
大部分公司其实都想要私有部署
小札啊 如果llama训练好了 肯定是财源滚滚
回到 “军事天地(Military)”