DeepSeek R1的代码没有公开啊!
版主: Softfist
-
DonnieTrump(唐闯璞)楼主
- 论坛支柱

- 帖子互动: 518
- 帖子: 10286
- 注册时间: 2024年 7月 1日 08:51
#3 Re: DeepSeek R1的代码没有公开啊!
公开了R1的详细算法,和R1模型,以及调用代码,可以方便在本地运行,但没有公开生成和训练模型代码。
其他公司可以按算法重写,并对任一个基本大模型,加上推理功能(象R1一样)。
其他公司可以按算法重写,并对任一个基本大模型,加上推理功能(象R1一样)。
x1
-
DonnieTrump(唐闯璞)楼主
- 论坛支柱

- 帖子互动: 518
- 帖子: 10286
- 注册时间: 2024年 7月 1日 08:51
-
DonnieTrump(唐闯璞)楼主
- 论坛支柱

- 帖子互动: 518
- 帖子: 10286
- 注册时间: 2024年 7月 1日 08:51
#9 Re: DeepSeek R1的代码没有公开啊!
#10 Re: DeepSeek R1的代码没有公开啊!
包含了模型的结构,超参数和权重
使用huggingface的库,直接下载就能跑
这种格式是LLM行业标准
使用huggingface的库,直接下载就能跑
这种格式是LLM行业标准
DonnieTrump 写了: 2025年 2月 4日 03:39 这个是完全的代码?那几个model...文件是啥?5G左右,既不像模型又不像数据。
https://huggingface.co/deepseek-ai/Deep ... /tree/main
-
DonnieTrump(唐闯璞)楼主
- 论坛支柱

- 帖子互动: 518
- 帖子: 10286
- 注册时间: 2024年 7月 1日 08:51


