目前还是需要O1和R1一起用
版主: hci
#1 目前还是需要O1和R1一起用
目前的经验是,O1的知识面更广,R1的推理能力似乎要更强些。两者能够互补,各自出一些主意,合在一起,才能解决疑难杂症。
其实就是两个实习生的作用。一个实习生不够,得两个,加上肉人老司机,三个臭皮匠,基本就无往而不胜了。
其实就是两个实习生的作用。一个实习生不够,得两个,加上肉人老司机,三个臭皮匠,基本就无往而不胜了。
x3

上次由 hci 在 2025年 1月 28日 15:50 修改。
原因: 未提供修改原因
原因: 未提供修改原因
-
- 论坛元老
Caravel 的博客 - 帖子互动: 662
- 帖子: 26539
- 注册时间: 2022年 7月 24日 17:21
#3 Re: 目前还是需要O1和R1一起用
估计是oai的训练数据质量更高hci 写了: 2025年 1月 28日 15:49 目前的经验是,O1的知识面更广,R1的推理能力似乎要更强些。两者能够互补,各自出一些主意,合在一起,才能解决疑难杂症。
其实就是两个实习生的作用。一个实习生不够,得两个,加上肉人老司机,三个臭皮匠,基本就无往而不胜了。
oai的推理训练是RL么,没人知道
-
- 论坛元老
Caravel 的博客 - 帖子互动: 662
- 帖子: 26539
- 注册时间: 2022年 7月 24日 17:21
#4 Re: 目前还是需要O1和R1一起用
这两天你怎么如此低调?hci 写了: 2025年 1月 28日 15:49 目前的经验是,O1的知识面更广,R1的推理能力似乎要更强些。两者能够互补,各自出一些主意,合在一起,才能解决疑难杂症。
其实就是两个实习生的作用。一个实习生不够,得两个,加上肉人老司机,三个臭皮匠,基本就无往而不胜了。
你和wdong是正经做AI的,没有来讨论DS
#8 Re: 目前还是需要O1和R1一起用
本来也是呀。DS之前就这样了。多如牛毛的GPT wrapper公司。
上次由 hci 在 2025年 2月 5日 15:24 修改。
原因: 未提供修改原因
原因: 未提供修改原因
#10 Re: 目前还是需要O1和R1一起用
也很多。以前在Llama上finetune,现在在DS上,没有本质区别。
上次由 hci 在 2025年 2月 5日 15:30 修改。
原因: 未提供修改原因
原因: 未提供修改原因