2月23日,昨天DeepSeek启动开源周,正式开源了第一个代码库FlashMLA,DeepSeek实测可以将让H800内存带宽达到3000GB/s、算力达到580TFLOPS,性能突破上限!今天DS也是让全球彻底卷疯了,继续推出第二弹代码库DeepEP项目,为MoE模型的训练和推理提供了高效通信工具,与此同时,人工智能初创公司Anthropic,今天宣布推出全球首个混合推理模型Claude 3.7 Sonnet,击败了DeepSeek-R1和OpenAI满血版o1,号称是迄今为止最智能的模型!
首先是DeepSeek对DeepEP的官方介绍,这是全球第一个用于MoE 模型训练和推理的开源 EP 通信库,主要以高效算力协同为核心目标,深度集成NVLink和RDMA技术,实现节点内/间超低延迟通信,同时提供训练阶段高吞吐量的预填充内核与推理阶段低延迟解码内核,显著加速混合专家模型的计算流程。
DeepEP通过原生FP8调度支持,减少显存占用并提升运算效率,配合灵活的GPU资源控制机制,可实现计算与通信流水线重叠,在保证精度的前提下最大限度释放硬件性能,为大规模MoE模型训练与推理提供高效通信解决方案。DeepSeek最近发布的代码库都相对硬核,我在今天稍微晚些的时候还会继续给大家做更详细的解读。
第二条重磅消息来自Anthropic,这家公司和DeepSeek类似,同样也是业界内的知名公司,今天Anthropic带来了最新的Claude 3.7 Sonnet,号称其迄今最智能的模型及全球首款混合推理模型,这个模型突破性实现了双模态思考,既能快速响应即时需求,又可通过分步推理展示详细逻辑链,兼顾效率与深度。
目前Claude 3.7 Sonnet数学与编码能力较前代3.5版本提升超10%,增强复杂任务处理水平,并且和DeepSeek-R1一样,首日起向全球用户免费开放,不过暂未上线“扩展思考”功能,此外Anthropic还配套推出Claude Code,开发者可通过终端直接委托工程级任务。Anthropic在长远发展蓝图中将DeepSeek和OpenAI两家公司视为主要的竞争对手,未来AI社区的竞争还会更加激烈!
更多游戏资讯请关注:电玩帮游戏资讯专区
电玩帮图文攻略 www.vgover.com