普通程序员如何转行为高附加值的AI Engineer
版主: hci
#1 普通程序员如何转行为高附加值的AI Engineer
本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。
看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
+1.00 积分 [版主 hci 发放的奖励]
x1
标签/Tags:
#4 Re: 普通程序员如何转行为高附加值的AI Engineer
這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。fantasist 写了: 2025年 7月 18日 01:55 本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。
看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
上次由 magagop 在 2025年 7月 18日 12:10 修改。
#7 Re: 普通程序员如何转行为高附加值的AI Engineer
硬件工程师在硅谷包裹一般是SWE的一半,没人会往这方向转吧,除非搞AI芯片能发大包。据我所知nvidia和amd做AI硬件的base和equity都很少(不算nvidia股价涨幅)。magagop 写了: 2025年 7月 18日 12:07 這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。
写CUDA kernel之类的应该算AI infra,在inference stack里应用广泛,也是一条之前没细讲的出路,这个其实挺适合Infra SWE。
#8 Re: 普通程序员如何转行为高附加值的AI Engineer
芯片好處是通用,AI不行了,還有別的,也沒人過來卷。fantasist 写了: 2025年 7月 18日 12:19 硬件工程师在硅谷包裹一般是SWE的一半,没人会往这方向转吧,除非搞AI芯片能发大包。据我所知nvidia和amd做AI硬件的base和equity都很少(不算nvidia股价涨幅)。
写CUDA kernel之类的应该算AI infra,在inference stack里应用广泛,也是一条之前没细讲的出路,这个其实挺适合Infra SWE。
#9 Re: 普通程序员如何转行为高附加值的AI Engineer
这是你朋友fantasist 写了: 2025年 7月 18日 01:55 本来想写一篇,发现朋友做了一期视频,大方向上讲的挺好,直接看吧。
看起来他们公司老板跑路后算法层面没什么大牛,对于pre-train/post-train research work不太了解。我认为coding强的码工只要下苦功,转行成researcher还是很有希望的。比如pre-train和post-train都需要数据,有很强文字等数据处理经验的码工完全可以搞一搞。infra层面,比如最近kimi-k2对muon optimizer的改进,就是通过各种实验想办法增强计算的numerical stability,其中占很大比例的搬砖的活我觉得普通程序员只要去做就有机会胜任。
最大的难点还是怎么去找到相关的工作。pre-train的厂家屈指可数,做出过能拿的出手的foundation model,确实都是世界上最顶尖的AI人才,经验积累不强的人往上靠的机会非常渺茫。而投入大量资源的做post-train的其实很少,不是视频里说的大多数公司都在(能)做。我比较了解的一些有一定资金实力的中厂,比如roblox和service now,想做post-train但都没多少卡,当然吸引不到好的researcher也不太可能做出厉害的成果。从实际的角度出发,选合适的AI公司去搞偏产品的backend和frontend比较容易,相应的基本没有溢价,主要是也许能找到机会再往AI顶层靠。
看了下频道节目
No offense
精致利己小市民气到disgusting 的程度
急急如丧家之犬
忙忙似漏网之鱼
忙忙似漏网之鱼
#13 Re: 普通程序员如何转行为高附加值的AI Engineer
芯片不是谁都能做,起码得懂半导体集成电路基本知识,加上还得穿大白下工厂超净室。秀才们能吃得了这种苦?现在的AI和当年的稻糠母泡沫一样,只不过是换了层皮的庞氏骗局。里面有金子(就如当年泡沫里还是有移动通讯这块有价值的部分),但远不如吹的。magagop 写了: 2025年 7月 18日 12:07 這個視頻完全沒有講AI加速器芯片和GPU芯片,那也是一個方向,不一定非要做LLM模型的才是AI,做芯片的當然也是AI。模型越來越大,最關鍵的瓶頸是硬件芯片,不是模型專家。
#16 Re: 普通程序员如何转行为高附加值的AI Engineer
可能他对向上管理之类的词过于敏感。他们的一系列视频从不教人怎么sabotage同事,而是从各种角度说怎么求同存异与上下级和peer合作,如何deliver项目给公司创造价值的同时,发展自己的leadership以及保证个人利益。people skills其实很多在厂里混的不如意的人非常需要学习。
#17 Re: 普通程序员如何转行为高附加值的AI Engineer
对fantasist 写了: 2025年 7月 20日 02:31 可能他对向上管理之类的词过于敏感。他们的一系列视频从不教人怎么sabotage同事,而是从各种角度说怎么求同存异与上下级和peer合作,如何deliver项目给公司创造价值的同时,发展自己的leadership以及保证个人利益。people skills其实很多在厂里混的不如意的人非常需要学习。
没发现什么问题
就是长得比较丑
-
newIdRobot(新器人)
- 论坛支柱

- 帖子互动: 398
- 帖子: 12982
- 注册时间: 2022年 7月 21日 21:29
#18 Re: 普通程序员如何转行为高附加值的AI Engineer
设计不下无尘室Bluesky 写了: 2025年 7月 19日 06:41 芯片不是谁都能做,起码得懂半导体集成电路基本知识,加上还得穿大白下工厂超净室。秀才们能吃得了这种苦?现在的AI和当年的稻糠母泡沫一样,只不过是换了层皮的庞氏骗局。里面有金子(就如当年泡沫里还是有移动通讯这块有价值的部分),但远不如吹的。
#19 Re: 普通程序员如何转行为高附加值的AI Engineer
最后也得下的。虽然现在有很多远程操控软件,可以跨州,甚至跨国调试,但具体到板子,很多情况得亲自操刀。现场的 tool driver 就算是老鸟,没责任心的也可能把板子给你烧了。






