可能国内的朋友还不知道,在欢天喜地加上花天酒地庆祝春节的时候,另一半世界,就是所谓的三分之二的受苦人,却因为国内一个小公司的大新闻而经历了冰火九重天。 事情的本身怎么看似乎都是正能量的好事,简单来说 ,就是一家名不见经传的小公司,杭州的深度求索人工智能公司上线并同步开源DeepSeek-V3模型,同时公布长达53页的技术报告,介绍关键技术和训练细节。最关键的是V3模型能力大幅升级,但训练仅仅花费557.6万美元,仅用2048块H800显卡,耗时不到两个月。做为参照,美国人工智能初创公司Anthropic曾透露,GPT-40的模型训练成本约为1亿美元。美国开放人工智能研究中心(OpenAI)点评,DeepSeek-V3让在有限算力预算内进行模型预训练这件事变得容易。总而言之,就是技术的突破甚至人类的福音。...
阅读全文