(转载)冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

STEM版,合并数学,物理,化学,科学,工程,机械。不包括生物、医学相关,和计算机相关内容。

版主: verdeliteTheMatrix

回复
goodegg(我是大陆人)楼主
知名作家
知名作家
帖子互动: 195
帖子: 921
注册时间: 2023年 7月 23日 03:31

#1 (转载)冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

帖子 goodegg(我是大陆人)楼主 »

此帖转自 goodegg 在 军事天地(Military) 的帖子:冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

deepseek一开源
谷歌就突破
之前Gemini被OpenAI压的死死的
连能做reasoning的模型都没有搞出来


冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

2025年02月06日

Jeff Dean:一次生成就能出正确代码。

在 DeepSeek 的强烈攻势下,这次轮到谷歌坐不住了。

本周三,该公司全面发布 Gemini 2.0 Flash、 Gemini 2.0 Flash-Lite 以及新一代旗舰大模型 Gemini 2.0 Pro 实验版本,并且还在 Gemini App 中推出了其推理模型 Gemini 2.0 Flash Thinking。

图片

下图为三个模型在通用、代码、推理、事实性、多语言、数学、长上下文、图像、音频和视频等多领域任务中的性能指标。

图片

在大模型排行榜上,Gemini 2.0-Pro 在 Chatbot Arena 所有类别中排名第一。Pro 版在代码等复杂任务上表现突出,Gemini Advanced 用户目前已经可以在 App 上进行试用了。
头像
MaLaRabbit
论坛点评
论坛点评
帖子互动: 151
帖子: 2748
注册时间: 2022年 7月 24日 02:16

#2 Re: (转载)冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

帖子 MaLaRabbit »

有免费的么?
goodegg 写了: 2025年 2月 6日 02:51 此帖转自 goodegg 在 军事天地(Military) 的帖子:冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

deepseek一开源
谷歌就突破
之前Gemini被OpenAI压的死死的
连能做reasoning的模型都没有搞出来


冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

2025年02月06日

Jeff Dean:一次生成就能出正确代码。

在 DeepSeek 的强烈攻势下,这次轮到谷歌坐不住了。

本周三,该公司全面发布 Gemini 2.0 Flash、 Gemini 2.0 Flash-Lite 以及新一代旗舰大模型 Gemini 2.0 Pro 实验版本,并且还在 Gemini App 中推出了其推理模型 Gemini 2.0 Flash Thinking。

图片

下图为三个模型在通用、代码、推理、事实性、多语言、数学、长上下文、图像、音频和视频等多领域任务中的性能指标。

图片

在大模型排行榜上,Gemini 2.0-Pro 在 Chatbot Arena 所有类别中排名第一。Pro 版在代码等复杂任务上表现突出,Gemini Advanced 用户目前已经可以在 App 上进行试用了。
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 279
帖子: 13694
注册时间: 2022年 7月 26日 00:35

#3 Re: (转载)冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

帖子 TheMatrix »

据说没通过草莓测试:

图片
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 279
帖子: 13694
注册时间: 2022年 7月 26日 00:35

#4 Re: (转载)冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

帖子 TheMatrix »

图片
drifter
论坛精英
论坛精英
帖子互动: 467
帖子: 7520
注册时间: 2022年 9月 1日 04:17

#5 Re: (转载)冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

帖子 drifter »

ds反复验证后回答3 结果还被不明真相的朝阳群众嘲笑 说这么简单的问题还想那么久
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 279
帖子: 13694
注册时间: 2022年 7月 26日 00:35

#6 Re: (转载)冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

帖子 TheMatrix »

我说再提示它一下吧。问“哪两个是r”。它还是错。

图片
上次由 TheMatrix 在 2025年 2月 6日 12:56 修改。
原因: 未提供修改原因
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 279
帖子: 13694
注册时间: 2022年 7月 26日 00:35

#7 Re: (转载)冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

帖子 TheMatrix »

完了。它开始瞎猜了。

图片
上次由 TheMatrix 在 2025年 2月 6日 12:58 修改。
原因: 未提供修改原因
回复

回到 “STEM”