新未名空间

两个50位数加法，用竖式算很容易，等价计算10个5位数加法

GPT做不了比这更难的题，写诗和谈心才是真正的擅长领域

FGH 写了： 2025年 10月 20日 09:21
我没有见过哪个小学生被要求做那样的加法题。你用GPT应该做真正需要的题目。

xiaoju 写了： 2025年 10月 20日 09:29
两个50位数加法，用竖式算很容易，等价计算10个5位数加法

GPT做不了比这更难的题，写诗和谈心才是真正的擅长领域

你出几道真正大学生做的题目

这帮搞ai的也是文人相轻，其实趋势很明显了，最迟明年ai必定会有学术上前所未有的发现。
很可能今后的诺贝尔奖也没人类什么事儿了

连数字都数不清楚，所谓的“做出”也只是“抄袭”而已

实际上只要稍微分析一下模型激活信息，不但能搞清是不是抄袭，还能知道是抄了什么的

FGH 写了： 2025年 10月 20日 09:33
你出几道真正大学生做的题目

不要做梦了。。。

整整一年美国AI没有任何进步，美帝把身家性命都压在scaling law这个反科学概念上了

pepper 写了： 2025年 10月 20日 09:43
这帮搞ai的也是文人相轻，其实趋势很明显了，最迟明年ai必定会有学术上前所未有的发现。
很可能今后的诺贝尔奖也没人类什么事儿了

xiaoju 写了： 2025年 10月 20日 09:50
连数字都数不清楚，所谓的“做出”也只是“抄袭”而已

实际上只要稍微分析一下模型激活信息，不但能搞清是不是抄袭，还能知道是抄了什么的

你猜你不是付费用户。没有使用就乱发言。
不是其实也没有关系，你遇到什么难题了我可以帮你问问。

我直接调用gpt的api，这货能干什么我比你清楚得多

FGH 写了： 2025年 10月 20日 09:53
你猜你不是付费用户。没有使用就乱发言。
不是其实也没有关系，你遇到什么难题了我可以帮你问问。

xiaoju 写了： 2025年 10月 20日 09:55
我直接调用gpt的api，这货能干什么我比你清楚得多

没有启用deep thinking还是差了很多。

还是回到做数学题上。你出两道大学生做的题目，我给你看看它的本事。

然而openai就没有deepthink的mode。。。

现在地球上只有deepseek可以强制deepthink，别的模型因为是包月制，think都是高兴的时候赏你的骨头，能骗过去坚决不思考

FGH 写了： 2025年 10月 20日 09:59
没有启用deep thinking还是差了很多。

还是回到做数学题上。你出两道大学生做的题目，我给你看看它的本事。

xiaoju 写了： 2025年 10月 20日 10:01
然而openai就没有deepthink的mode。。。

现在地球上只有deepseek可以强制deepthink，别的模型因为是包月制，think都是高兴的时候赏你的骨头，能骗过去坚决不思考

我们这样空口说白话没有意思。不如找两道大学生的题目，研究生的也行，
让DeepSeek和ChatGPT分别去做。

swanswan 写了： 2025年 10月 19日 17:30
生成解开了数学难题。原来是检索到了答案。你还能指望这些弱智实现agi。

OpenAI researchers recently claimed a major math breakthrough on X, but quickly walked it back after criticism from the community, including Deepmind CEO Demis Hassabis, who called out the sloppy communication.

It started with a now-deleted tweet from OpenAI manager Kevin Weil, who wrote that GPT-5 had "found solutions to 10 (!) previously unsolved Erdős problems" and made progress on eleven more. He described these problems as "open for decades." Other OpenAI researchers echoed the claim.

The wording made it sound like GPT-5 had independently produced mathematical proofs for tough number theory questions - a potential scientific breakthrough and a sign that generative AI could uncover unknown solutions, showing its ability to drive novel research and open the door to major advances.

Mathematician Thomas Bloom, who runs erdosproblems.com, pushed back right away. He called the statements "a dramatic misinterpretation," clarifying that "open" on his site just means he personally doesn't know the solution - not that the problem is actually unsolved. GPT-5 had only surfaced existing research that Bloom had missed.

Deepmind-CEO Demis Hassabis called the episode "embarrassing", and Meta AI chief Yann LeCun pointed out that OpenAI had basically bought into its own hype ("Hoisted by their own GPTards").

利用AI读文献倒是个很好的应用。

FGH 写了： 2025年 10月 20日 07:11
《The Decoder》指出，这次事件被夸大掩盖了一个更真实的点：GPT-5 在“文献搜集/术语不统一的检索任务”上确实显示出实用价值；Terence Tao 也多次表示，短期内 AI 在数学中的最现实作用，往往是加速检索与常规推理，而非攻克公认的深难未解问题。

话说回来，虽然GPT5还没有能够成神（攻克公认的深难未解问题），但是已经达到了博士生水平，能够协助数学家进行数学证明了。

Copilot 解数学题靠运气。

GPT貌似强那么一点点

DQQ 写了： 2025年 10月 20日 11:27
Copilot 解数学题靠运气。

GPT貌似强那么一点点

让GPT解数学题必须启用它的thinking功能。
如果是浏览器版，还要选择Extended thinking。

你得证明答案不是背下来的。。。

大学生的题目范围很小，比如微积分，只要死背下来几本习题集范围，剩下的就是翻译问题

FGH 写了： 2025年 10月 20日 10:08
我们这样空口说白话没有意思。不如找两道大学生的题目，研究生的也行，
让DeepSeek和ChatGPT分别去做。

xiaoju 写了： 2025年 10月 20日 07:19
不是这样

实际上GPT是有数学上的能力限制的，连加减法都做不了。直接做出的难题，必然是从哪里偷看来的。只有CoT深度思考模式可能做出难题，这时候检查核对步骤就行

这个事情说明openai从上到下充斥着不学无术的草台班子

你老对chain of thoughts 是不是理解错了
GPT5当然有cot, cot 也是LLM根据预测token来的，最简单的实现就是ask model solve it step by step
Cot不是啥厉害玩意儿，是个LLM都会，training 过海量解题过程就可以了

xiaoju 写了： 2025年 10月 20日 17:55
你得证明答案不是背下来的。。。

大学生的题目范围很小，比如微积分，只要死背下来几本习题集范围，剩下的就是翻译问题

你也可以找研究生课啊。能把那么多题的答案都背下来也很难得了。

这个是一眼假的东西，ai科学家一般不懂数学，一惊一乍很正常，没想到现在发推特比发PRL出错丢脸的机会更大。

你没用过openai的api吧

openai的cot是隐藏的，因为成本太高，只在高兴的时候才给你块糖

lonelyarcher 写了： 2025年 10月 20日 18:08
你老对chain of thoughts 是不是理解错了
GPT5当然有cot, cot 也是LLM根据预测token来的，最简单的实现就是ask model solve it step by step
Cot不是啥厉害玩意儿，是个LLM都会，training 过海量解题过程就可以了

背诵不是AI，汽车跑的比人快，不能说明汽车是AI啊

FGH 写了： 2025年 10月 20日 18:22
你也可以找研究生课啊。能把那么多题的答案都背下来也很难得了。

xiaoju 写了： 2025年 10月 20日 19:51
背诵不是AI，汽车跑的比人快，不能说明汽车是AI啊

AI不仅是背下了答案，还能够融会贯通和触类旁通。

新未名空间

完了，ai科学家又闹笑话了。

#21 Re: 完了，ai科学家又闹笑话了。

#22 Re: 完了，ai科学家又闹笑话了。

#23 Re: 完了，ai科学家又闹笑话了。

#24 Re: 完了，ai科学家又闹笑话了。

#25 Re: 完了，ai科学家又闹笑话了。

#26 Re: 完了，ai科学家又闹笑话了。

#27 Re: 完了，ai科学家又闹笑话了。

#28 Re: 完了，ai科学家又闹笑话了。

#29 Re: 完了，ai科学家又闹笑话了。

#30 Re: 完了，ai科学家又闹笑话了。

#31 Re: 完了，ai科学家又闹笑话了。

#32 Re: 完了，ai科学家又闹笑话了。

#33 Re: 完了，ai科学家又闹笑话了。

#34 Re: 完了，ai科学家又闹笑话了。

#35 Re: 完了，ai科学家又闹笑话了。

#36 Re: 完了，ai科学家又闹笑话了。

#37 Re: 完了，ai科学家又闹笑话了。

#38 Re: 完了，ai科学家又闹笑话了。

#39 Re: 完了，ai科学家又闹笑话了。

#40 Re: 完了，ai科学家又闹笑话了。