目前还是需要O1和R1一起用

hci

目前的经验是，O1的知识面更广，R1的推理能力似乎要更强些。两者能够互补，各自出一些主意，合在一起，才能解决疑难杂症。

其实就是两个实习生的作用。一个实习生不够，得两个，加上肉人老司机，三个臭皮匠，基本就无往而不胜了。

hci

到底他们说的解决了问题没有，并不告诉他们，这就没有给他们训练数据。

也是个办法。

Caravel · 帖子由 **Caravel** » 2025年 1月 28日 16:40

hci 写了： 2025年 1月 28日 15:49 目前的经验是，O1的知识面更广，R1的推理能力似乎要更强些。两者能够互补，各自出一些主意，合在一起，才能解决疑难杂症。

其实就是两个实习生的作用。一个实习生不够，得两个，加上肉人老司机，三个臭皮匠，基本就无往而不胜了。

估计是oai的训练数据质量更高

oai的推理训练是RL么，没人知道

Caravel · 帖子由 **Caravel** » 2025年 1月 28日 23:16

hci 写了： 2025年 1月 28日 15:49 目前的经验是，O1的知识面更广，R1的推理能力似乎要更强些。两者能够互补，各自出一些主意，合在一起，才能解决疑难杂症。

其实就是两个实习生的作用。一个实习生不够，得两个，加上肉人老司机，三个臭皮匠，基本就无往而不胜了。

这两天你怎么如此低调？

你和wdong是正经做AI的，没有来讨论DS

hci

我的话都说完了，DS没有带来什么变化。

Caravel 写了： 2025年 1月 28日 23:16 这两天你怎么如此低调？

你和wdong是正经做AI的，没有来讨论DS

stonesthat

hci 写了： 2025年 1月 28日 15:54 到底他们说的解决了问题没有，并不告诉他们，这就没有给他们训练数据。

也是个办法。

对，我从来不告诉它们问题解决了。但它们看看自己最后的建议，还是能猜到个六七成吧。

drifter · 帖子由 **drifter** » 2025年 2月 5日 15:21

hci 写了： 2025年 1月 29日 10:45 我的话都说完了，DS没有什么带来变化。

阿猫阿狗现在都可以开个作坊搞ai了

hci

本来也是呀。DS之前就这样了。多如牛毛的GPT wrapper公司。

drifter 写了： 2025年 2月 5日 15:21 阿猫阿狗现在都可以开个作坊搞ai了

drifter · 帖子由 **drifter** » 2025年 2月 5日 15:27

hci 写了： 2025年 2月 5日 15:24 本来也是呀。DS之前就这样了。多如牛毛的GPT wrapper公司。

不知道你说的wrapper是什么
我是指用大模型为基础开发行业应用的专用模型

hci

也很多。以前在Llama上finetune，现在在DS上，没有本质区别。

drifter 写了： 2025年 2月 5日 15:27 不知道你说的wrapper是什么
我是指用大模型为基础开发行业应用的专用模型

drifter · 帖子由 **drifter** » 2025年 2月 5日 15:34

hci 写了： 2025年 2月 5日 15:29 也很多。以前在Llama上finetune，现在在DS上，没有本质区别。

门槛低了知道有一条可行的省钱办法而且效果也不错

新未名空间