分页: 4 / 5

#62 Re: Deepseek-OCR

发表于 : 2025年 10月 22日 18:31
banpingcu

我要是现在跟你说hci 就是三十年后的人工智能第二次浪潮之父,你肯定说what?天不生Hinton ,万古如长夜。Hci 这个民科,水王,满嘴胡咧咧,他算那棵葱?能跟Hinton 比。傻逼。

这就是Hinton三十年前面对的状况。为什么很多人坚持不到底?因为你这样的人太多,口水太旺。

fantasist 写了: 2025年 10月 22日 18:08

大家都不是傻逼,看事不可为,就去做别的了。我上个回复就是告诉你,很多时候只有极少数犟种能坚持到最后被证明是正确的,这就是世界的运转方式。一个过几十年才能被验证的理论一出来就众星捧月,这个叫科幻,在现实中不存在。你看来对这个世界会出现很多“不怕权威的纯粹的共产主义者”有幻想,那只能呵呵了,接着做梦吧。


#63 Re: Deepseek-OCR

发表于 : 2025年 10月 22日 18:44
TheMatrix
banpingcu 写了: 2025年 10月 22日 18:31

我要是现在跟你说hci 就是三十年后的人工智能第二次浪潮之父,你肯定说what?天不生Hinton ,万古如长夜。Hci 这个民科,水王,满嘴胡咧咧,他算那棵葱?能跟Hinton 比。傻逼。

这就是Hinton三十年前面对的状况。为什么很多人坚持不到底?因为你这样的人太多,口水太旺。

你这句话很厉害啊,一下把人corner住了。

我知道怎么回。但是我先不说。


#64 Re: Deepseek-OCR

发表于 : 2025年 10月 22日 19:05
fantasist
banpingcu 写了: 2025年 10月 22日 18:31

我要是现在跟你说hci 就是三十年后的人工智能第二次浪潮之父,你肯定说what?天不生Hinton ,万古如长夜。Hci 这个民科,水王,满嘴胡咧咧,他算那棵葱?能跟Hinton 比。傻逼。

这就是Hinton三十年前面对的状况。为什么很多人坚持不到底?因为你这样的人太多,口水太旺。

不受欢迎的教授和民科还是有区别的。至少几层网络能识别数字,其他人不相信这个继续做下去能比其它路线好而已。坚持不到底更多的是因为绝大多数人无法在自己都证明不了的事情上坚持,是内因而不是外因。hci除了在这里天天吹逼,做出了啥?说句不好听的连被口水的资格都没有。
图灵奖如果不是颁给奠定理论基础的人,而是在某论坛上号称提前5年就讲过这个观点的talk的人,那就牛逼了。世界虽然魔幻,但还没到这程度。


#65 Re: Deepseek-OCR

发表于 : 2025年 10月 22日 19:41
anesthetic

在这能争出个啥,直接去hugging,reddit看看就知道了,llm霉蒂大屎已去,一亩上在大厂搞ai的都忙着在国内找下家呢


#66 Re: Deepseek-OCR

发表于 : 2025年 10月 22日 20:00
fantasist
anesthetic 写了: 2025年 10月 22日 19:41

在这能争出个啥,直接去hugging,reddit看看就知道了,llm霉蒂大屎已去,一亩上在大厂搞ai的都忙着在国内找下家呢

我去年就在国内干过ai厂,从pretrain 100B+ param模型到产品E2E都做的那种,可以说对中美的GenAI生态都有一手了解。最大的感受就是国内高学历年轻人供给无限,996任劳任怨,平均工资是十分之一。最恐怖的是这帮人在公司里加班到很晚回家,显得非常自然,似乎生活就该如此。
business能不能挣钱另说,至少招人干活这块,老板是容易太多了。这也是为什么我前边有个帖里吐槽这边招人困难,供给奇缺,不砸钱看不到希望。
美帝大厂搞AI的除非是体力顶尖的卷王,回国绝对卷不过这帮人。当然你看到的那些有时间发帖报怨的肯定不是卷王,回国躺平还有点可能,找下家是奢望。


#67 Re: Deepseek-OCR

发表于 : 2025年 10月 22日 20:36
hci

今天听说买它AI裁员600人。

anesthetic 写了: 2025年 10月 22日 19:41

在这能争出个啥,直接去hugging,reddit看看就知道了,llm霉蒂大屎已去,一亩上在大厂搞ai的都忙着在国内找下家呢


#68 Re: Deepseek-OCR

发表于 : 2025年 10月 22日 23:25
jkxf
fantasist 写了: 2025年 10月 22日 20:00

我去年就在国内干过ai厂,从pretrain 100B+ param模型到产品E2E都做的那种,可以说对中美的GenAI生态都有一手了解。最大的感受就是国内高学历年轻人供给无限,996任劳任怨,平均工资是十分之一。最恐怖的是这帮人在公司里加班到很晚回家,显得非常自然,似乎生活就该如此。
business能不能挣钱另说,至少招人干活这块,老板是容易太多了。这也是为什么我前边有个帖里吐槽这边招人困难,供给奇缺,不砸钱看不到希望。
美帝大厂搞AI的除非是体力顶尖的卷王,回国绝对卷不过这帮人。当然你看到的那些有时间发帖报怨的肯定不是卷王,回国躺平还有点可能,找下家是奢望。

美国招人困难😓那么多找不到工作的码工和学生
你们招人啥要求啊


#69 Re: Deepseek-OCR

发表于 : 2025年 10月 22日 23:52
anesthetic
fantasist 写了: 2025年 10月 22日 20:00

我去年就在国内干过ai厂,从pretrain 100B+ param模型到产品E2E都做的那种,可以说对中美的GenAI生态都有一手了解。最大的感受就是国内高学历年轻人供给无限,996任劳任怨,平均工资是十分之一。最恐怖的是这帮人在公司里加班到很晚回家,显得非常自然,似乎生活就该如此。
business能不能挣钱另说,至少招人干活这块,老板是容易太多了。这也是为什么我前边有个帖里吐槽这边招人困难,供给奇缺,不砸钱看不到希望。
美帝大厂搞AI的除非是体力顶尖的卷王,回国绝对卷不过这帮人。当然你看到的那些有时间发帖报怨的肯定不是卷王,回国躺平还有点可能,找下家是奢望。

看看meta裁员,老中是重灾区。。。现在llm已经死胡同了,老中活干完就该咔嚓了


#70 Re: Deepseek-OCR

发表于 : 2025年 10月 22日 23:52
anesthetic
hci 写了: 2025年 10月 22日 20:36

今天听说买它AI裁员600人。

小田都被砍了


#71 Re: Deepseek-OCR

发表于 : 2025年 10月 22日 23:59
pnlmpnlm
anesthetic 写了: 2025年 10月 22日 23:52

看看meta裁员,老中是重灾区。。。现在llm已经死胡同了,老中活干完就该咔嚓了

为什么老中是重灾区?有统计吗,还是本身LLM本身就是一半是老中。


#72 Re: Deepseek-OCR

发表于 : 2025年 10月 23日 00:32
fantasist
pnlmpnlm 写了: 2025年 10月 22日 23:59

为什么老中是重灾区?有统计吗,还是本身LLM本身就是一半是老中。

搞LLM的老中不止一半。
像meta这种地方,很多年前feeds/ads之类的组早就几乎全老中了,经常有其它国家的人在blind上怒喷组里日常都说中文,他/她不feel inclusive。


#73 Re: Deepseek-OCR

发表于 : 2025年 10月 23日 00:49
fantasist
jkxf 写了: 2025年 10月 22日 23:25

美国招人困难😓那么多找不到工作的码工和学生
你们招人啥要求啊

我刚翻阅了一下Andrej Karpathy的这个教学视频: 看上去挺适合入门的。
我觉得面试难度对认真学过的ng要求很低,不需要有业界经验,能从头到尾跟着写一遍,整点数据训个模型出来,跑一下eval,知道整个流程大致在做啥即可。pytorch基本操作别太生疏,再了解一些业界普遍使用的算法概念,差不多应该能通过我们组的面试。不少人有相关项目,但写不出代码,那种吹的再好听我们也不会要的。
AI infra某方面的专才也是非常欢迎的,比如我面到一个没学过training但出于兴趣手搓mlx kernel的很聪明的candidate,也给了strong hire。
简历太不相关被HR刷掉就没办法了。不管怎么说现在想进真上手训模型的组还是挺难的,毕竟GPU贵,名额很少。一般招人HC更多的是做各种调用api的product,说实话我觉得跟普通的product backend没有什么区别,不推荐。


#74 Re: Deepseek-OCR

发表于 : 2025年 10月 23日 15:00
hahan
fantasist 写了: 2025年 10月 23日 00:49

我刚翻阅了一下Andrej Karpathy的这个教学视频: 看上去挺适合入门的。
我觉得面试难度对认真学过的ng要求很低,不需要有业界经验,能从头到尾跟着写一遍,整点数据训个模型出来,跑一下eval,知道整个流程大致在做啥即可。pytorch基本操作别太生疏,再了解一些业界普遍使用的算法概念,差不多应该能通过我们组的面试。不少人有相关项目,但写不出代码,那种吹的再好听我们也不会要的。
AI infra某方面的专才也是非常欢迎的,比如我面到一个没学过training但出于兴趣手搓mlx kernel的很聪明的candidate,也给了strong hire。
简历太不相关被HR刷掉就没办法了。不管怎么说现在想进真上手训模型的组还是挺难的,毕竟GPU贵,名额很少。一般招人HC更多的是做各种调用api的product,说实话我觉得跟普通的product backend没有什么区别,不推荐。

掉api的和搞infra的性价比很低
一样的钱
天天跟催命一样抢ttm


#75 Re: Deepseek-OCR

发表于 : 2025年 10月 23日 15:01
hahan
banpingcu 写了: 2025年 10月 22日 13:27

你生当其时,但是别太执着。

硬件现在还差口气。现在看来,不管未来是什么架构,neuro network这条路是走通了。各种架构的核心,还是矩阵乘法。矩阵乘法的最底层,还是排序。排序,在硬件层面的实现,才是最终解决方案。现在硬件层面,还是以arithmetic和logic计算的为核心,转换为排序,效率很低。但是,如果要以排序为核心架构计算机,而且如果要融合计算和存储,那么整个冯诺伊曼体系就要被推翻,从硬件,到系统到软件到算法,都得重构。得花几代人的时间。

其实,从六十七年代早就应该开始做这个工作了。美帝/西方的堕落,不是一天两天了。

neuro network这条路是走通了

走通了是啥意思


#76 Re: Deepseek-OCR

发表于 : 2025年 10月 23日 20:30
banpingcu

能用Neural Network 达到AGI

hahan 写了: 2025年 10月 23日 15:01

neuro network这条路是走通了

走通了是啥意思


#77 Re: Deepseek-OCR

发表于 : 2025年 10月 24日 00:22
Caravel
hci 写了: 2025年 10月 22日 10:51

我们是看戏的无关人士。

扎克给亿元大包,人力成本压1 /10,分摊一下是好事。

现在美帝这个搞法:资金全部投入十个左右公司,其它公司因缺乏资金纷纷倒闭,不是一个正确的选择。

公司内部也一样,有拿亿元大包的,同时大力裁人,也不是个正确的选择。

结果就是本可以出力的人,现在在一边等着看笑话。就是字面意思上的等着看笑话。

扎克这种搞法是瞎搞,把市场机制都搞坏了

土鳖那里的相对工资才是真实价值


#78 Re: Deepseek-OCR

发表于 : 2025年 10月 24日 00:27
Caravel
赖美豪中 写了: 2025年 10月 22日 12:03

这个还真不是新思路,只能说国内落地能力强。这个ocr 模型2022年就有一堆文章了。关键是实现不好

这是不错的idea,但是能不能在大模型上起作用不好说

现在推上吹DeepSeek很多是趁流量


#79 Re: Deepseek-OCR

发表于 : 2025年 10月 24日 02:35
fantasist
Caravel 写了: 2025年 10月 24日 00:22

扎克这种搞法是瞎搞,把市场机制都搞坏了

土鳖那里的相对工资才是真实价值

如果重金挖5-10个,是说的通。我的思路是找几个真大佬带来先进经验,内部挑人组一个精英团队,保证优先供卡,年底前先做个好的llama5开源出来,稳扎稳打胜算很高。meta从不缺踏实肯干水平不错的engineer,只要有好模型一切都好办,把模型集成到各产品上之类的项目不需要担心。后来从把山大王招来管团队,事情就变得魔幻了。小渣也是眼光够奇葩的,业界名声不佳的researcher也收。


#80 Re: Deepseek-OCR

发表于 : 2025年 10月 24日 02:52
stonesthat
fantasist 写了: 2025年 10月 23日 00:49

我刚翻阅了一下Andrej Karpathy的这个教学视频: 看上去挺适合入门的。
我觉得面试难度对认真学过的ng要求很低,不需要有业界经验,能从头到尾跟着写一遍,整点数据训个模型出来,跑一下eval,知道整个流程大致在做啥即可。pytorch基本操作别太生疏,再了解一些业界普遍使用的算法概念,差不多应该能通过我们组的面试。不少人有相关项目,但写不出代码,那种吹的再好听我们也不会要的。
AI infra某方面的专才也是非常欢迎的,比如我面到一个没学过training但出于兴趣手搓mlx kernel的很聪明的candidate,也给了strong hire。
简历太不相关被HR刷掉就没办法了。不管怎么说现在想进真上手训模型的组还是挺难的,毕竟GPU贵,名额很少。一般招人HC更多的是做各种调用api的product,说实话我觉得跟普通的product backend没有什么区别,不推荐。

这视频只有 pretraining 吧,但现在卷 pretraining 已经没啥花样了。
自己全流程训出来模型才有戏,但自己训出来了的人也可以自己干吧。
要看paper的话那就还是难。


#81 Re: Deepseek-OCR

发表于 : 2025年 10月 24日 14:35
fantasist
stonesthat 写了: 2025年 10月 24日 02:52

这视频只有 pretraining 吧,但现在卷 pretraining 已经没啥花样了。
自己全流程训出来模型才有戏,但自己训出来了的人也可以自己干吧。
要看paper的话那就还是难。

我说的是newgrad,能手写一个模型,不管pretrain还是posttrain,E2E走一遍,coding能力和真实的理解应该已经beat 99.9%的candidate了。不知道其它公司怎样,我们看到这种踏实做事的candidate肯定愿意招,不用玩什么花样。我觉得绝大多数人的问题是不爱get hands dirty,天天被“大佬”的推或者“DS又发了篇划时代的paper”这种消息遛得晕头转向,看似懂的很多什么话题都能吹一些,但实际上手照paper实现个基本的rotary embedding都struggle。
自己干是不太可能的,普通人上哪找卡、搞数据,从去年开始资金和人力投入都不能少。普通人拥有的资源恐怕几十B的模型都训不动,直接拿来做产品如果发现哪里不好用也只能认栽。
看paper难点主要在于,光读没有用,没资源试,就无法确认它是不是真的跟吹的一样好,虽然比只看公众号的还是要强多了。