分页: 1 / 1
#1 完了!OpenAI o3疑似在FrontierMath测试上造假
发表于 : 2025年 1月 19日 09:14
由 TheMatrix
据说各大AI解决奥赛数学已经小菜一碟了。Terence Tao气不忿,纠集60个数学家,出了一套FrontierMath,要为难一下AI。结果AI只做出了其中的2%。Terence Tao说:数学家的颜面暂时守住了。
来看看FrontierMath到底长什么样:

#2 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 19日 09:24
由 TheMatrix
首先这些问题很难。即使对数学家也很难。这都是各领域总结出来的经典的问题。
但是各领域出题人有答案。如果他们写出来,最好以一种适合AI训练的方式写出来,AI学习一下,类似的问题AI能不能回答?
数学家自己都没有答案的问题,AI能不能想出来?
#3 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 00:56
由 Caravel
TheMatrix 写了: 2025年 1月 19日 09:14
据说各大AI解决奥赛数学已经小菜一碟了。Terence Tao气不忿,纠集60个数学家,出了一套FrontierMath,要为难一下AI。结果AI只做出了其中的2%。Terence Tao说:数学家的颜面暂时守住了。
来看看FrontierMath到底长什么样:
最新爆料
这个公司是openAI提供funding的,openAI可以看他们的问题。双方对此保密,最近才被发现。
#4 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 09:52
由 TheMatrix
Caravel 写了: 2025年 1月 20日 00:56
最新爆料
这个公司是openAI提供funding的,openAI可以看他们的问题。双方对此保密,最近才被发现。
no silver bullet.
#5 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 12:22
由 Caravel
TheMatrix 写了: 2025年 1月 20日 09:52
no silver bullet.
难怪openai分很高
#6 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 12:40
由 TheMatrix
#7 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 12:43
由 TheMatrix
#8 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 14:07
由 TheMatrix
#9 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 14:08
由 TheMatrix
#10 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 14:10
由 TheMatrix
#11 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 14:15
由 justChat
任何愿意花半下午时间了解transformer的人都知道,这思路不可能解决任何新的问题。
#12 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 14:22
由 TheMatrix
#13 Re: 来看看用来测试AI math的FrontierMath长什么样
发表于 : 2025年 1月 20日 14:31
由 TheMatrix