写两句Imagenet

版主: hci

回复
wdong(万事休)楼主
见习作家
见习作家
帖子互动: 99
帖子: 420
注册时间: 2023年 11月 13日 15:13

#1 写两句Imagenet

帖子 wdong(万事休)楼主 »

隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。

第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。

非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?


李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。

+1.00 积分 [版主 hci 发放的奖励]
x1 图片

标签/Tags:
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 268
帖子: 13469
注册时间: 2022年 7月 26日 00:35

#2 Re: 写两句Imagenet

帖子 TheMatrix »

wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。

第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。

非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?


李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
你说的是STEM版有人贬低李飞飞。

我也不同意。

李飞飞做的imagenet是很重要的。催生了视觉人工智能的第一次飞跃。

视觉并没有做完。现在只做了一半:object segmentation可以说磕磕绊绊基本算做差不多了。

但是还有另一半:

1,空间智能,也就是物体之间的相对位置,或者视频中物体之间的相对速度。没有这个机器人不可能大行其道。

这也是李飞飞提出来的。所以李飞飞还是很厉害的。

2,另外还有:视觉还要接入语言模型。也就是视频要能转换成语言,而且是自然语言,而且转换出来的语言还能反过来复原视频,做到场景的复现。

这是我认为。
Caravel
论坛元老
论坛元老
Caravel 的博客
帖子互动: 659
帖子: 26509
注册时间: 2022年 7月 24日 17:21

#3 Re: 写两句Imagenet

帖子 Caravel »

wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。

第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。

非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?


李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
我赞同你,李飞飞大局观很牛,STEM版那几个见识不行。
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 4021
帖子: 60304
注册时间: 2022年 7月 22日 01:22

#4 Re: 写两句Imagenet

帖子 huangchong(净坛使者) »

wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。

第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。

非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?


李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
跟颜宁放一块。。。

盐宁那些东西,没了她只不过换个人做。这年月最不缺的就是又有资源,又没什么特殊想法的。

李菲菲这个东西, 至少还是极大推进了人类技术进步的,哪是一个档次的事。
x2 图片
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 736
帖子: 7484
注册时间: 2022年 7月 23日 22:13

#5 Re: 写两句Imagenet

帖子 wass »

wdong 写了: 2025年 2月 9日 19:01 隔壁版有人编排李飞飞,我作为当年参与者看不下去,说两句。

第一,这个项目的前瞻性体现在当年既发不出去paper也拿不到funding。现在高引用那篇是个poster。那时做系统的在硅谷横着走,机器视觉有点像CS里的火坑,用的是matlab。一帮子人去搞这么个不着边际的东西不容易,也就princeton级别的有这胆识。一作是把博士论文押在上面的。

第二,当年抓图用的是PlanetLab上数千台服务器。是有工程难度的,也得调动得了资源。这是06-07年的事情,AWS也就是同时才开始吹云计算。这事情概念上容易,真要干不是随便放哪里就能做出来的。

非要说工作量,工作量更大的默默无闻的多了去了。物理上不也发现个粒子就发诺贝尔奖的?


李飞飞和颜宁两个人,光工作量就不是一般人卷得过的。你们有啥好不服气的。
应该得图灵奖,四人帮
wdong(万事休)楼主
见习作家
见习作家
帖子互动: 99
帖子: 420
注册时间: 2023年 11月 13日 15:13

#6 Re: 写两句Imagenet

帖子 wdong(万事休)楼主 »

你说的这些有道理。但是现在更大的战场被开辟出来了,所以视觉的东西反而觉得不那么重要了。

汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言,所有编程语言}

以前的电脑只能用电脑语言编程。LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗?

现在所谓的prompt engineering,就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系,至少要争取占个坑将来查起来查得到我。

我对版上朋友的建议,就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。

+1.00 积分 [版主 hci 发放的奖励]
x1 图片
上次由 wdong 在 2025年 2月 9日 20:59 修改。
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 863
帖子: 18529
注册时间: 2022年 7月 23日 23:48

#7 Re: 写两句Imagenet

帖子 hahan »

huangchong 写了: 2025年 2月 9日 20:42 跟颜宁放一块。。。

盐宁那些东西,没了她只不过换个人做。这年月最不缺的就是又有资源,又没什么特殊想法的。

李菲菲这个东西, 至少还是极大推进了人类技术进步的,哪是一个档次的事。
没有无缘无故的爱
也没有无缘无故的恨

群众不是无缘无故非议李的
初中生就能干的活
前瞻性 魄力
这些东西
说破大天去
也不能服众
更何况现在imagenet已经not relevant 了

李飞飞最牛的是父母不明不白的到美国
去西藏净化
嫁白人
妥妥的白左的全球化炒作标本
急急如丧家之犬
忙忙似漏网之鱼
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 268
帖子: 13469
注册时间: 2022年 7月 26日 00:35

#8 Re: 写两句Imagenet

帖子 TheMatrix »

wdong 写了: 2025年 2月 9日 20:51 你说的这些有道理。但是现在更大的战场被开辟出来了,所以视觉的东西反而觉得不那么重要了。

汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言,所有编程语言}

以前的电脑只能用电脑语言编程。LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗?

现在所谓的prompt engineering,就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系,至少要争取占个坑将来查起来查得到我。

我对版上朋友的建议,就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。
同意:“LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。”

这个战场是AI agent。

这既是一个应用领域的战场,也是一个有理论意义的一个超级大迭代。

但是目前主要是一个应用领域的战场。AI数学和AI coding,等等。

理论意义上的超级大迭代,可能还是比较远的远景。
wdong(万事休)楼主
见习作家
见习作家
帖子互动: 99
帖子: 420
注册时间: 2023年 11月 13日 15:13

#9 Re: 写两句Imagenet

帖子 wdong(万事休)楼主 »

没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情,你发明个你的方法改进一点点,publish出来,说不定以后就成了经典算法。

Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
上次由 wdong 在 2025年 2月 9日 21:04 修改。
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 268
帖子: 13469
注册时间: 2022年 7月 26日 00:35

#10 Re: 写两句Imagenet

帖子 TheMatrix »

wdong 写了: 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好,你发明个你的方法,publish出来,说不定以后就成了经典算法。

Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
当然,应用领域我也关心。
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 736
帖子: 7484
注册时间: 2022年 7月 23日 22:13

#11 Re: 写两句Imagenet

帖子 wass »

wdong 写了: 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情,你发明个你的方法改进一点点,publish出来,说不定以后就成了经典算法。

Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
llama3没有moe,让人诟病,据说是想train moe没有做出来,搞了一个dense model
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 736
帖子: 7484
注册时间: 2022年 7月 23日 22:13

#12 Re: 写两句Imagenet

帖子 wass »

李飞飞应该获奖,不管技术水平,贡献在那里

另一方面,学术上好像没有什么贡献,做公司产品目前没有什么进展,当然也可能跟Ilya一样,闭关练功

她的学生andrej karpathy水平不错
wdong(万事休)楼主
见习作家
见习作家
帖子互动: 99
帖子: 420
注册时间: 2023年 11月 13日 15:13

#14 Re: 写两句Imagenet

帖子 wdong(万事休)楼主 »

当年李飞飞自己在实验室鼓励学生的说法,就是他们机器视觉领域最厉害的人有两个,一个叫Pietro Perona,一个叫Jitendra Malik。Perona是Malik的学生(她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。
头像
TheMatrix
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 268
帖子: 13469
注册时间: 2022年 7月 26日 00:35

#15 Re: 写两句Imagenet

帖子 TheMatrix »

wdong 写了: 2025年 2月 9日 21:02 没那么遥远。现在大部分行业和领域都有对接AI的需要。你随便找个领域的随便一个问题,用agent的思路去做。现有的已经publish的路子效果不好 -- 这是大概率的事情,你发明个你的方法改进一点点,publish出来,说不定以后就成了经典算法。

Resnet很复杂吗?现在不都扎根到了所有模型里。我看过llama3的架构,每一层就是两个resnet。
视觉不做好,AI就不能以类人的方式工作。最简单一个travel agent就需要以API的方式工作。自动驾驶真的能上路吗?可能还是需要某种程度的车路协同。当然,改造各领域的工作环境以适应现在的AI,也是大的战场。
wdong(万事休)楼主
见习作家
见习作家
帖子互动: 99
帖子: 420
注册时间: 2023年 11月 13日 15:13

#16 Re: 写两句Imagenet

帖子 wdong(万事休)楼主 »

自动驾驶能上路难道还需要怀疑吗?而且自动驾驶技术做到上路还没用到LLM技术。你的要求系统性地高于我的要求。我看着过不了几年就能做出来,我就自动认为已经做出来了。
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 736
帖子: 7484
注册时间: 2022年 7月 23日 22:13

#17 Re: 写两句Imagenet

帖子 wass »

wdong 写了: 2025年 2月 9日 21:28 当年李飞飞自己在实验室鼓励学生的说法,就是他们机器视觉领域最厉害的人有两个,一个叫Pietro Perona,一个叫Jitendra Malik。Perona是Malik的学生(她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。
都是昔日黄花,都让dl给统一了
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 736
帖子: 7484
注册时间: 2022年 7月 23日 22:13

#18 Re: 写两句Imagenet

帖子 wass »

wdong 写了: 2025年 2月 9日 21:34 自动驾驶能上路难道还需要怀疑吗?而且自动驾驶技术做到上路还没用到LLM技术。你的要求系统性地高于我的要求。我看着过不了几年就能做出来,我就自动认为已经做出来了。
一个城市搞几百个点,这些点之间跑容易一点
Caravel
论坛元老
论坛元老
Caravel 的博客
帖子互动: 659
帖子: 26509
注册时间: 2022年 7月 24日 17:21

#19 Re: 写两句Imagenet

帖子 Caravel »

wdong 写了: 2025年 2月 9日 21:28 当年李飞飞自己在实验室鼓励学生的说法,就是他们机器视觉领域最厉害的人有两个,一个叫Pietro Perona,一个叫Jitendra Malik。Perona是Malik的学生(她自己是Perona的学生)。这俩人的学术贡献是什么有多少人还知道。
我当年想学机器视觉,找了一本教科书来看,看了几天就放弃了。现在看来非常幸运,否则Alex net一出来这些老古董都进博物馆了。
Caravel
论坛元老
论坛元老
Caravel 的博客
帖子互动: 659
帖子: 26509
注册时间: 2022年 7月 24日 17:21

#20 Re: 写两句Imagenet

帖子 Caravel »

wdong 写了: 2025年 2月 9日 20:51 你说的这些有道理。但是现在更大的战场被开辟出来了,所以视觉的东西反而觉得不那么重要了。

汇编语言 -> {basic, fortran} -> Pascal/C -> {C++, java, python, ....} -> ... -> LLM = {所有自然预言,所有编程语言}

以前的电脑只能用电脑语言编程。LLM作为一个自动机,它处理的语言就是可以用来对它进行编程的语言。这是一个撼动整个software engineering基础的天大的事情。这他妈是北美新大陆。这时候你再去垦地中海那点田还有意思吗?

现在所谓的prompt engineering,就是小孩蒙着眼睛在瞎玩。我目前的努力是试图建立起agent-oriented programming的体系,至少要争取占个坑将来查起来查得到我。

我对版上朋友的建议,就是参与到这个探索新世界的过程中来。现在谁都有机会占一片地。
有道理,这个势头是很明显的了

现在LLM的基础层面能力还需要加强,推理能力刚刚开始涌现,这两年估计就可以看见明显的增强,或许会到超人类水平。

应用层面,agent是一个方向。

还有一个robot为什么不能像R1一样,把动作分解成很小然后再行动
fantasist
见习点评
见习点评
帖子互动: 217
帖子: 1628
注册时间: 2022年 7月 24日 19:52

#21 Re: 写两句Imagenet

帖子 fantasist »

提前两步是先烈,提前一步是先驱,后来的跟风。
以技术不够复杂来批评visionary是没有道理的。
回复

回到 “葵花宝典(Programming)”