可能很多人都不知道 现在的transformer架构既不用tf也不用pytorch

版主: hci

回复
fulvshou(腐驴受)楼主
论坛元老
论坛元老
帖子互动: 572
帖子: 25361
注册时间: 2022年 8月 26日 20:30

#1 可能很多人都不知道 现在的transformer架构既不用tf也不用pytorch

帖子 fulvshou(腐驴受)楼主 »

嘿嘿
我是腐驴受 家住恒河边
腐是腐驴的腐呀
受是腐驴受的受
头像
hci(海螺子)
论坛支柱
论坛支柱
帖子互动: 490
帖子: 10136
注册时间: 2022年 7月 22日 15:29

#2 Re: 可能很多人都不知道 现在的transformer架构既不用tf也不用pytorch

帖子 hci(海螺子) »

训练和推理的架构本来就不同。

OpenAI用什么东西训练GPT?Meta用什么训练Llama。你知道么?
fulvshou(腐驴受)楼主
论坛元老
论坛元老
帖子互动: 572
帖子: 25361
注册时间: 2022年 8月 26日 20:30

#3 Re: 可能很多人都不知道 现在的transformer架构既不用tf也不用pytorch

帖子 fulvshou(腐驴受)楼主 »

hci 写了: 2024年 5月 15日 15:07 训练和推理的架构本来就不同。

OpenAI用什么东西训练GPT?Meta用什么训练Llama。你知道么?
Inhouse transformer framework
股沟开源了一个
T5x

+1.00 积分 [版主 hci 发放的奖励]
我是腐驴受 家住恒河边
腐是腐驴的腐呀
受是腐驴受的受
回复

回到 “葵花宝典(Programming)”