写两句Imagenet
版主: hci
#1 写两句Imagenet
隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。
第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。
第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。
非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?
李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。
第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。
非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?
李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
+1.00 积分 [版主 hci 发放的奖励]
x1

标签/Tags:
-
- 论坛支柱
2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 268
- 帖子: 13469
- 注册时间: 2022年 7月 26日 00:35
#2 Re: 写两句Imagenet
你说的是STEM版有人贬低李飞飞。wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。
第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。
第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。
非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?
李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
我也不同意。
李飞飞做的imagenet是很重要的。催生了视觉人工智能的第一次飞跃。
视觉并没有做完。现在只做了一半:object segmentation可以说磕磕绊绊基本算做差不多了。
但是还有另一半:
1,空间智能,也就是物体之间的相对位置,或者视频中物体之间的相对速度。没有这个机器人不可能大行其道。
这也是李飞飞提出来的。所以李飞飞还是很厉害的。
2,另外还有:视觉还要接入语言模型。也就是视频要能转换成语言,而且是自然语言,而且转换出来的语言还能反过来复原视频,做到场景的复现。
这是我认为。
-
- 论坛元老
Caravel 的博客 - 帖子互动: 659
- 帖子: 26509
- 注册时间: 2022年 7月 24日 17:21
#3 Re: 写两句Imagenet
我赞同你,李飞飞大局观很牛,STEM版那几个见识不行。wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。
第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。
第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。
非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?
李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
#4 Re: 写两句Imagenet
跟颜宁放一块。。。wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。
第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。
第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。
非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?
李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
盐宁那些东西,没了她只不过换个人做。这年月最不缺的就是又有资源,又没什么特殊想法的。
李菲菲这个东西, 至少还是极大推进了人类技术进步的,哪是一个档次的事。
x2

#5 Re: 写两句Imagenet
应该得图灵奖,四人帮wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。
第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。
第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。
非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?
李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
#6 Re: 写两句Imagenet
你说的这些有道理。但是现在更大的战场被开辟出来了,所以视觉的东西反而觉得不那么重要了。
汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言,所有编程语言}
以前的电脑只能用电脑语言编程。LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗?
现在所谓的prompt engineering,就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系,至少要争取占个坑将来查起来查得到我。
我对版上朋友的建议,就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。
汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言,所有编程语言}
以前的电脑只能用电脑语言编程。LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗?
现在所谓的prompt engineering,就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系,至少要争取占个坑将来查起来查得到我。
我对版上朋友的建议,就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。
+1.00 积分 [版主 hci 发放的奖励]
x1

上次由 wdong 在 2025年 2月 9日 20:59 修改。
#7 Re: 写两句Imagenet
没有无缘无故的爱huangchong 写了: 2025年 2月 9日 20:42 跟颜宁放一块。。。
盐宁那些东西,没了她只不过换个人做。这年月最不缺的就是又有资源,又没什么特殊想法的。
李菲菲这个东西, 至少还是极大推进了人类技术进步的,哪是一个档次的事。
也没有无缘无故的恨
群众不是无缘无故非议李的
初中生就能干的活
前瞻性 魄力
这些东西
说破大天去
也不能服众
更何况现在imagenet已经not relevant 了
李飞飞最牛的是父母不明不白的到美国
去西藏净化
嫁白人
妥妥的白左的全球化炒作标本
急急如丧家之犬
忙忙似漏网之鱼
忙忙似漏网之鱼
-
- 论坛支柱
2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 268
- 帖子: 13469
- 注册时间: 2022年 7月 26日 00:35
#8 Re: 写两句Imagenet
同意:“LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。”wdong 写了: 2025年 2月 9日 20:51 你说的这些有道理。但是现在更大的战场被开辟出来了,所以视觉的东西反而觉得不那么重要了。
汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言,所有编程语言}
以前的电脑只能用电脑语言编程。LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗?
现在所谓的prompt engineering,就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系,至少要争取占个坑将来查起来查得到我。
我对版上朋友的建议,就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。
这个战场是AI agent。
这既是一个应用领域的战场,也是一个有理论意义的一个超级大迭代。
但是目前主要是一个应用领域的战场。AI数学和AI coding,等等。
理论意义上的超级大迭代,可能还是比较远的远景。
#9 Re: 写两句Imagenet
没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情,你发明个你的方法改进一点点,publish出来,说不定以后就成了经典算法。
Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
上次由 wdong 在 2025年 2月 9日 21:04 修改。
-
- 论坛支柱
2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 268
- 帖子: 13469
- 注册时间: 2022年 7月 26日 00:35
#10 Re: 写两句Imagenet
当然,应用领域我也关心。wdong 写了: 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好,你发明个你的方法,publish出来,说不定以后就成了经典算法。
Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
#11 Re: 写两句Imagenet
llama3没有moe,让人诟病,据说是想train moe没有做出来,搞了一个dense modelwdong 写了: 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情,你发明个你的方法改进一点点,publish出来,说不定以后就成了经典算法。
Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
#12 Re: 写两句Imagenet
李飞飞应该获奖,不管技术水平,贡献在那里
另一方面,学术上好像没有什么贡献,做公司产品目前没有什么进展,当然也可能跟Ilya一样,闭关练功
她的学生andrej karpathy水平不错
另一方面,学术上好像没有什么贡献,做公司产品目前没有什么进展,当然也可能跟Ilya一样,闭关练功
她的学生andrej karpathy水平不错
#14 Re: 写两句Imagenet
当年李飞飞自己在实验室鼓励学生的说法,就是他们机器视觉领域最厉害的人有两个,一个叫Pietro Perona,一个叫Jitendra Malik。Perona是Malik的学生(她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。
-
- 论坛支柱
2024年度优秀版主
TheMatrix 的博客 - 帖子互动: 268
- 帖子: 13469
- 注册时间: 2022年 7月 26日 00:35
#15 Re: 写两句Imagenet
视觉不做好,AI就不能以类人的方式工作。最简单一个travel agent就需要以API的方式工作。自动驾驶真的能上路吗?可能还是需要某种程度的车路协同。当然,改造各领域的工作环境以适应现在的AI,也是大的战场。wdong 写了: 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情,你发明个你的方法改进一点点,publish出来,说不定以后就成了经典算法。
Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
#16 Re: 写两句Imagenet
自动驾驶能上路难道还需要怀疑吗?而且自动驾驶技术做到上路还没用到LLM技术。你的要求系统性地高于我的要求。我看着过不了几年就能做出来,我就自动认为已经做出来了。
-
- 论坛元老
Caravel 的博客 - 帖子互动: 659
- 帖子: 26509
- 注册时间: 2022年 7月 24日 17:21
#19 Re: 写两句Imagenet
我当年想学机器视觉,找了一本教科书来看,看了几天就放弃了。现在看来非常幸运,否则Alex net一出来这些老古董都进博物馆了。wdong 写了: 2025年 2月 9日 21:28 当年李飞飞自己在实验室鼓励学生的说法,就是他们机器视觉领域最厉害的人有两个,一个叫Pietro Perona,一个叫Jitendra Malik。Perona是Malik的学生(她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。
-
- 论坛元老
Caravel 的博客 - 帖子互动: 659
- 帖子: 26509
- 注册时间: 2022年 7月 24日 17:21
#20 Re: 写两句Imagenet
有道理,这个势头是很明显的了wdong 写了: 2025年 2月 9日 20:51 你说的这些有道理。但是现在更大的战场被开辟出来了,所以视觉的东西反而觉得不那么重要了。
汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言,所有编程语言}
以前的电脑只能用电脑语言编程。LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗?
现在所谓的prompt engineering,就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系,至少要争取占个坑将来查起来查得到我。
我对版上朋友的建议,就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。
现在LLM的基础层面能力还需要加强,推理能力刚刚开始涌现,这两年估计就可以看见明显的增强,或许会到超人类水平。
应用层面,agent是一个方向。
还有一个robot为什么不能像R1一样,把动作分解成很小然后再行动