分页: 1 / 1

#1 Cursor和Windsurf发布了一个GLM finetune模型

发表于 : 2025年 10月 30日 23:31
Caravel

此帖转自 Caravel 在 葵花宝典(Programming) 的帖子:Windsurf发布了一个GLM finetune模型

base model还是很难训练的,一般团队搞不定


#2 Re: Cursor和Windsurf发布了一个GLM finetune模型

发表于 : 2025年 10月 30日 23:37
Caravel

美国的这种小startup如果没有开源模型

就被大厂搞死了


#3 Re: (转载)Windsurf发布了一个GLM finetune模型

发表于 : 2025年 10月 30日 23:39
pepper

训练一次几千万美金几个月时间,没时间没经验真的搞不来
国内团队都是从小模型开始慢慢积累经验,我帝的公司感觉还是太浮躁


#4 Re: (转载)Windsurf发布了一个GLM finetune模型

发表于 : 2025年 10月 30日 23:48
Caravel
pepper 写了: 2025年 10月 30日 23:39

训练一次几千万美金几个月时间,没时间没经验真的搞不来
国内团队都是从小模型开始慢慢积累经验,我帝的公司感觉还是太浮躁

最近中国好几个公司感觉开窍了一样


#5 Re: (转载)Windsurf发布了一个GLM finetune模型

发表于 : 2025年 10月 31日 00:23
pepper
Caravel 写了: 2025年 10月 30日 23:48

最近中国好几个公司感觉开窍了一样

Deepseek把路走通了


#6 Re: (转载)Windsurf发布了一个GLM finetune模型

发表于 : 2025年 10月 31日 00:26
Caravel
pepper 写了: 2025年 10月 31日 00:23

Deepseek把路走通了

开源这个生态其实很好

大部分公司其实都想要私有部署

小札啊 如果llama训练好了 肯定是财源滚滚