爆料称下个月推出DeepSeek-R2,你期待吗?

据最新消息,国内AI企业深度求索(DeepSeek)计划于2025年5月推出新一代大模型DeepSeek-R2,其性能与成本优势引发行业震动 。

该模型采用自研Hybrid MoE 3.0架构,总参数量达1.2万亿,动态激活参数仅780亿,在处理复杂任务时效率较前代提升近一倍 。最受关注的是其成本优势——单位推理成本较GPT-4降低97.3%,生成百万token的费用从2.19美元降至0.27美元,这得益于华为昇腾910B芯片82%的高利用率及分布式训练框架优化 。技术层面,DeepSeek-R2在多模态领域实现突破:COCO图像分割任务准确率达92.4%,医疗诊断模块胸部X光识别准确率超98%,工业质检误检率压至千万分之7.2 。硬件方面,该模型基于512 PetaFLOPS算力的昇腾集群训练,性能达英伟达A100集群的91%,标志着国产AI芯片生态的重大突破 。

行业分析指出,若该模型性能属实,或将重塑全球AI竞争格局。其“低成本+高性能”组合不仅威胁OpenAI等企业的市场地位,更可能加速全球AI供应链向中国倾斜 。目前资本市场已出现连锁反应,拓维信息、中科曙光等国产算力概念股受热捧 。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com