王炸!感谢DeepSeek开源,下周DS将公开5大代码库!

2月21日,DeepSeek在这一周接连放出大招,周二「方案选单」前脚马斯克公开了Grok3,后脚DeepSeek推出了新论文NSA,今天DS团队表示下周是DeepSeek的开源周,将陆续开源5个repos,DeepSeek非常诚恳地表示,“我们是一个探索AGI的小团队,将以完全透明的方式分享我们微小但真诚的进展。”

这五个代码库都是DeepSeek已经文档化、部署过的基础构建模块,在生产环境中经过实战检验,DS承诺:“作为开源社区的一部分,我们相信分享的每一条线路,都会成为加速旅程的集体动力,下周每日开源活动即将到来。没有象牙塔——只有纯粹的车库能量和社区驱动的创新!”

“开源周”这个概念是对标OpenAI,去年底山姆·奥特曼开了个连续12天的技术发布会,不过由于OpenAI是闭源的,GPT系列模型的核心代码和训练数据不公开,OpenAI被戏称为CloseAI,完全限制了社区参与和创新。作为对比,DeepSeek这次的开源周获得大量研究人员的力挺,Github上Star数量已经超越了OpenAI旗下的几个项目,同时DeepSeek还登顶了Huggingface点赞榜,成为今年全球最受欢迎的新模型!

这次开源周DeepSeek说要开源5个代码库,这里我根据DS现有发表过的论文预测,首先有可能发布的就是这周的NSA原生稀疏注意力机制的新论文模块,论文我在社区给大家做过详细解读,但是那篇解读更多的是从读懂论文角度出发,DS真正厉害的地方在于,NSA已经达到了工业级水准,原论文中Kernel的具体方法不算清晰,而且内存优化、模型训练和推理上还有很多细节,DeepSeek可能会在下周以开源模型+发布会+QA的形式,将这些内容全部公开。除此之外,DS在年后还发布了一个多模态Janus-Pro-7B的小模型,加上DeepSeek-V3和DeepSeek-R1的一些训练工具模块也可能会公开。

DeepSeek公告里还提到“没有高不可攀的象牙塔,只有纯粹的车库文化和社区驱动的创新”,我认为是DS在整个AI大模型领域发起了一场全新的革新运动,DeepSeek追随的是硅谷科技创新的车库文化,推崇务实低调,不希望将领先的技术关在象牙塔里高高树起,而是以开源的方式分享给社区,全球共同来推动AI技术的进步,从这个角度来说,DeepSeek已经走在了最前列。

下周同样可能引起巨大波动的还有股市,上次DeepSeek发布R1模型的时候直接引发了今年美股单日的最大跌幅,这次DeepSeek的开源周计划可能会倒闭大量闭源企业走向开源,近期恒科指数暴涨,阿里Qwen等模型也因为DS热受到更多的关注!下周,我也还会继续在小黑盒为大家带来DeepSeek技术的最新解读。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com