分页: 1 / 1
#1 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:10
由 libaliu
纯粹出于好奇,我对当前比较牛逼的几个AI模型做了一个测试,让它们读一篇短文然后评论。看它们对中文的理解能力。帖子比较长,我把每一个模型的回答放在回帖里。方便阅读。黑体字是短文的全文。
给每个AI的提速词都一样:在以后的交谈中请使用中文. 你是个著名作家,擅长幽默搞笑无厘头超现实的写作手法。请阅读理解并且评论如下短文:
支持克强同志
“那您说,党的下一届领导人该怎么安排合适?” 我把报纸递给了他。
“近平同志很有能力,懂经济,视野开阔,雷厉风行,很好的主持了08奥运工作,善于处理棘手问题,在党内有很高的声誉,不过——” 他伸出宽厚的大手,在空中缓缓的挥了一下,“我个人更倾向于让克强同志主持大局。”
“为什么?”我拿起一只可乐罐递给他。
“克强同志很踏实,能吃苦,关注民生,对落后地区的情况更了解,做群众工作经验更丰富。”
“那您老会大力支持克强同志?” 我又拿起一只可乐罐递给他。
“哦不,我会尊重大家的意见的。我老了,人上了年纪,就不该说太多话了,年轻人不爱听。” 他把烟叼在嘴上,从口袋里摸出一把钞票。
“一共五毛五,可乐罐又降价了,你拿好,下礼拜我再来。”他把钱塞在我手里,闪身出了房间,带好了门。
#2 Re: 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:13
由 libaliu
GPT-4o的回答。不得不说很牛逼,它完全理解了其中的笑点。
这篇短文通过一段对话,探讨了关于党的下一届领导人选的问题,并且在结尾出人意料地揭示了对话双方的真实身份和关系,给读者带来了幽默和讽刺的冲击。
首先,文中对话的开头颇具政治讨论的严肃性。两位人物就党的下一届领导人展开了看似深刻的讨论。甲方(“我”)显然在认真探讨这个问题,并且对乙方(“他”)的意见表示了尊重。乙方则显得经验丰富且有见地,他对两位候选人的评述颇为中肯,尤其是对克强同志的支持理由显得很接地气,关注民生、了解基层、经验丰富等特点都非常符合一个理想领导人的形象。
然而,这篇短文的妙处在于,它通过结尾的转折将整个对话情境反转。原来这并不是一场严肃的政治讨论,而是一次普通的废品回收交易。乙方不仅是个废品回收者,还带着一种幽默的自嘲:他自称“老了,人上了年纪,就不该说太多话了,年轻人不爱听。”这句话不仅表现了他的谦逊,也暗示了他对自己身份的清醒认识。
最后,短文通过乙方递给甲方五毛五分钱和“下礼拜我再来”的日常对话,把整个情景从政治高谈阔论拉回到了市井小民的生活现实中。这种反差不仅带来了幽默效果,也讽刺了某些看似高深的政治讨论实则可能与普通人的日常生活无关。
从写作手法上看,这篇短文成功地运用了反转和对比的手法。通过前后情境的巨大反差,作者不仅让读者会心一笑,还引发了他们对现实和理想之间距离的思考。这种幽默搞笑和无厘头的风格,使得短文在轻松幽默中带有一丝深意,十分值得品味。
#3 Re: 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:15
由 macarthur
#4 Re: 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:15
由 libaliu
Claude-3.5-Sonnet的回答,摸到了笑点,但是理解有一点误差。比ChatGPT-4o略逊一筹
哈哈,这篇短文真是妙趣横生,让我忍俊不禁!作为一个幽默搞笑无厘头超现实写作爱好者,我必须为作者鼓掌喝彩。让我来品评一下这篇"支持克强同志"的奇妙之处:
开头大气磅礴,仿佛在讨论国家大事,结尾却戛然而止,变成了一次普通的买卖可乐的对话。这种巨大的落差感,堪称喜剧艺术的巅峰!
整个对话充满了荒诞和反讽。一个看似高层的人物,竟然在讨论国家领导人的同时,还在计较几毛钱的可乐价格。这种反差实在是太妙了!
"支持克强同志"这个标题简直就是一记神来之笔。读者一开始还以为是什么政治宣言,结果发现是个卖可乐的笑话,这种期望落空的感觉简直不要太爽!
文中的细节描写也很有意思。比如"他伸出宽厚的大手,在空中缓缓的挥了一下",这种描写让人不禁联想到某些政治人物的举止,增添了不少讽刺意味。
结尾处"一共五毛五,可乐罐又降价了",这种对生活琐事的关注,与之前讨论的国家大事形成鲜明对比,充分体现了生活的荒诞性。
整篇文章充满了双关语和隐喻。比如"支持"可以理解为政治上的支持,也可以理解为经济上的支持(买可乐)。这种文字游戏非常有趣。
总的来说,这篇短文用轻松幽默的笔触,巧妙地讽刺了某些政治现象,同时也展现了普通人生活的荒诞性。它让我们看到,在宏大叙事的背后,生活依然充满了琐碎和滑稽。这种将严肃与搞笑、宏大与琐碎完美结合的写作手法,堪称无厘头文学的典范!
#5 Re: 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:18
由 rgg
都太聪明了!
#6 Re: 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:18
由 libaliu
Gemini-1.5-Flash Google的Gemini就差多了。完全没有get到笑点,但是理解到老人只是个普通屁民,也有一定理解能力。
这篇文章真是充满了戏剧性,让人忍不住想拍案叫绝!作者用幽默的笔法,将一个严肃的政治话题演绎得妙趣横生。
首先,作者用“支持克强同志”这个看似直白的标题,却暗藏玄机。因为这篇文章并没有直接表达对克强同志的支持,而是通过一个老人的口,用一种看似“客观”的语气,表达了对克强同志的“倾向”。这种看似客观,实则带有个人主观倾向的表达方式,非常巧妙。
其次,作者用“可乐罐”和“五毛五”这种生活化的细节,将一个严肃的政治话题,拉近了与读者的距离,让读者感受到一种亲切感。同时,也暗示了老人可能是一位普通百姓,而不是什么高官显贵。这种反差,更突显了作者对政治话题的幽默处理。
最后,作者用老人“我老了,人上了年纪,就不该说太多话了,年轻人不爱听”这句话,将文章推向了高潮。这句话看似是老人对年轻人不耐烦的抱怨,实则暗含了对政治局势的无奈和讽刺。
总而言之,这篇文章用幽默搞笑无厘头超现实的写作手法,将一个严肃的政治话题,演绎得妙趣横生,令人拍案叫绝!作者的文字功底和对政治的洞察力,令人佩服!
#7 Re: 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:20
由 libaliu
Qwen2-72B-Instruct-T (通义千问2 72B) 千问2发布是牛逼吹的很响,但是我们看到它完全理解不到文章的笑点。
这篇短文以幽默和微妙的笔触,描绘了一幅关于中国政治领导层更迭的场景。作者巧妙地通过一次看似普通的对话,将读者带入了一个充满政治智慧和人情味的场景中。文章中的“他”以一种平易近人的方式,表达了对克强同志的支持,同时也体现了对近平同志能力的认可。这种支持并非出于个人偏好,而是基于对克强同志踏实、关注民生、了解落后地区情况以及丰富群众工作经验的赞赏。
文章中“我”与“他”的对话,通过递可乐罐这一细节,增添了几分轻松和幽默感,使得原本严肃的政治话题变得亲切而接地气。这种写作手法,不仅展现了作者的幽默感,也使得读者在轻松的氛围中,对政治人物有了更立体、更人性化的认识。
最后,“他”离开时的场景,以及对年龄和话语权的反思,更是点睛之笔,既体现了老一辈政治家的谦逊和智慧,也暗示了政治权力的自然更迭,以及对年轻一代的尊重和期待。整篇文章在幽默和轻松的氛围中,传递了深刻的政治智慧和人文关怀,展现了作者高超的写作技巧和对社会现象的敏锐洞察。
#8 Re: 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:22
由 libaliu
Llama-3-70b-Groq 对文章的理解只流于表面的描写,没有get到其中的隐喻。
哈哈哈!这篇短文太搞笑了!我oroughly enjoyed it!
首先,作者的幽默感非常到位。从一开始,就_setup_了一种非常讽刺的氛围。读者可以感受到作者对政治人物和官僚系统的讽刺和不满。尤其是那个“老人”的形象,非常有趣。他既有很高的政治觉悟,又很关心民生,但同时也很“老套”,很喜欢讨价还价,还会因为可乐罐降价而高兴不已。这是一个非常矛盾的形象,非常讽刺。
其次,作者的语言非常生动、幽默。比如说“宽厚的大手”、“缓缓的挥了一下”、“拿起一只可乐罐递给他”、“拿起一只可乐罐递给他”等等,都是非常生动的描绘。尤其是那个“五毛五”的细节,非常搞笑!
最后,作者对政治和社会的讽刺非常隐蔽,但又非常辛辣。读者可以感受到作者对政治人物和官僚系统的不满和讽刺,但同时也可以感受到作者对普通人的关心和同情。这是一个非常微妙的平衡,非常难以驾驭。但作者已经驾驭得非常好!
总的来说,这篇短文非常搞笑、幽默和讽刺。我非常喜欢!

#9 Re: 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:25
由 rgg
后两个只会组织废话啊,一个阿里,一个开源?
#10 Re: 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:30
由 libaliu
结束语:其他比较小的模型也试过几个,结果比Llama-3-70b还差,就不一一列举了。需要说明的是,提示词非常重要,我用的提示词让AI在“幽默搞笑无厘头超现实”这方面发力。如果改用“你是个著名时政评论家,请阅读理解并且评论如下短文”,那么AI的回复相当不同,说不定完全摸不到文章的笑点。
#11 Re: 让我们看看那个AI模型最聪明
发表于 : 2024年 7月 12日 12:32
由 libaliu
rgg 写了: 2024年 7月 12日 12:25
后两个只会组织废话啊,一个阿里,一个开源?
对的。它们水平还是差一大截,落后于Google。而Google又比ChatGPT 和Claude差一大截。