分页: 1 / 1
#1 Cursor和Windsurf发布了一个GLM finetune模型
发表于 : 2025年 10月 30日 23:31
由 Caravel
此帖转自 Caravel 在 葵花宝典(Programming) 的帖子:Windsurf发布了一个GLM finetune模型
base model还是很难训练的,一般团队搞不定
#2 Re: Cursor和Windsurf发布了一个GLM finetune模型
发表于 : 2025年 10月 30日 23:37
由 Caravel
美国的这种小startup如果没有开源模型
就被大厂搞死了
#3 Re: (转载)Windsurf发布了一个GLM finetune模型
发表于 : 2025年 10月 30日 23:39
由 pepper
训练一次几千万美金几个月时间,没时间没经验真的搞不来
国内团队都是从小模型开始慢慢积累经验,我帝的公司感觉还是太浮躁
#4 Re: (转载)Windsurf发布了一个GLM finetune模型
发表于 : 2025年 10月 30日 23:48
由 Caravel
pepper 写了: 2025年 10月 30日 23:39
训练一次几千万美金几个月时间,没时间没经验真的搞不来
国内团队都是从小模型开始慢慢积累经验,我帝的公司感觉还是太浮躁
最近中国好几个公司感觉开窍了一样
#5 Re: (转载)Windsurf发布了一个GLM finetune模型
发表于 : 2025年 10月 31日 00:23
由 pepper
Caravel 写了: 2025年 10月 30日 23:48
最近中国好几个公司感觉开窍了一样
Deepseek把路走通了
#6 Re: (转载)Windsurf发布了一个GLM finetune模型
发表于 : 2025年 10月 31日 00:26
由 Caravel
pepper 写了: 2025年 10月 31日 00:23
Deepseek把路走通了
开源这个生态其实很好
大部分公司其实都想要私有部署
小札啊 如果llama训练好了 肯定是财源滚滚