分页: 1 / 1

#1 完了!OpenAI o3疑似在FrontierMath测试上造假

发表于 : 2025年 1月 19日 09:14
TheMatrix
据说各大AI解决奥赛数学已经小菜一碟了。Terence Tao气不忿,纠集60个数学家,出了一套FrontierMath,要为难一下AI。结果AI只做出了其中的2%。Terence Tao说:数学家的颜面暂时守住了。

来看看FrontierMath到底长什么样:

图片

图片

图片

#2 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 19日 09:24
TheMatrix
首先这些问题很难。即使对数学家也很难。这都是各领域总结出来的经典的问题。

但是各领域出题人有答案。如果他们写出来,最好以一种适合AI训练的方式写出来,AI学习一下,类似的问题AI能不能回答?

数学家自己都没有答案的问题,AI能不能想出来?

#3 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 00:56
Caravel
TheMatrix 写了: 2025年 1月 19日 09:14 据说各大AI解决奥赛数学已经小菜一碟了。Terence Tao气不忿,纠集60个数学家,出了一套FrontierMath,要为难一下AI。结果AI只做出了其中的2%。Terence Tao说:数学家的颜面暂时守住了。

来看看FrontierMath到底长什么样:

图片

图片

图片
最新爆料

这个公司是openAI提供funding的,openAI可以看他们的问题。双方对此保密,最近才被发现。

#4 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 09:52
TheMatrix
Caravel 写了: 2025年 1月 20日 00:56 最新爆料

这个公司是openAI提供funding的,openAI可以看他们的问题。双方对此保密,最近才被发现。
no silver bullet.

#5 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 12:22
Caravel
TheMatrix 写了: 2025年 1月 20日 09:52 no silver bullet.
难怪openai分很高

#6 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 12:40
TheMatrix
Caravel 写了: 2025年 1月 20日 00:56 最新爆料

这个公司是openAI提供funding的,openAI可以看他们的问题。双方对此保密,最近才被发现。
看来属实啊。

https://www.huxiu.com/article/3925446.html
https://www.zhihu.com/question/10078773 ... 3215772453


图片

图片

图片

图片

图片

#7 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 12:43
TheMatrix
图片

#8 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 14:07
TheMatrix
图片

#9 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 14:08
TheMatrix
图片

#10 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 14:10
TheMatrix
图片

#11 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 14:15
justChat
任何愿意花半下午时间了解transformer的人都知道,这思路不可能解决任何新的问题。
TheMatrix 写了: 2025年 1月 20日 14:07 图片

#12 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 14:22
TheMatrix
图片

#13 Re: 来看看用来测试AI math的FrontierMath长什么样

发表于 : 2025年 1月 20日 14:31
TheMatrix
图片