新未名空间

base model还是很难训练的，一般团队搞不定

美国的这种小startup如果没有开源模型

就被大厂搞死了

训练一次几千万美金几个月时间，没时间没经验真的搞不来
国内团队都是从小模型开始慢慢积累经验，我帝的公司感觉还是太浮躁

pepper 写了： 2025年 10月 30日 23:39
训练一次几千万美金几个月时间，没时间没经验真的搞不来
国内团队都是从小模型开始慢慢积累经验，我帝的公司感觉还是太浮躁

最近中国好几个公司感觉开窍了一样

Caravel 写了： 2025年 10月 30日 23:48
最近中国好几个公司感觉开窍了一样

Deepseek把路走通了

pepper 写了： 2025年 10月 31日 00:23
Deepseek把路走通了

开源这个生态其实很好

大部分公司其实都想要私有部署

小札啊如果llama训练好了肯定是财源滚滚

Cursor和Windsurf发布了一个GLM finetune模型