昨天凌晨,微软在官网开源了DeepSeek-R1的“无限制”版——MAI-DS-R1。
MAI-DS-R1 是由微软人工智能团队进行后训练的DeepSeek-R1推理模型,旨在提升其在被屏蔽话题上的响应能力并优化风险状况,同时保持原有的推理能力和竞争优势。
MAI-DS-R1 成功解锁了原R1模型大多数先前被屏蔽的查询,并在相关安全基准测试中表现优于近期发布的R1-1776模型。这些成果的取得同时保持了原有DeepSeek-R1模型的通用推理能力。
有些想体验一下放飞自我版R1的小伙伴们可以试试这个,说不定可以打开全新的世界。
![]()
微软在训练 MAI-DS-R1 的过程中,从大约 350000 个被屏蔽的主题示例中,收集和筛选查询关键词,将这些关键词转化为多个问题,并翻译成不同语言。
还通过 DeepSeek R1 和内部模型为这些问题生成答案和思维链。此外,训练数据中还纳入了来自Tulu3 SFT数据集的 110K 个安全和违规示例,这些示例涵盖了 CoCoNot、WildJailbreak 和 WildGuardMix 等内容。
![]()
随后,微软对MAI-DS-R1进行了综合评估。在敏感话题响应方面,MAI-DS-R1能够成功响应99.3%的敏感话题提示,这一表现显著优于DeepSeek R1和R1-1776。
在安全性评估方面,MAI-DS-R1在HarmBench评估中仍表现出色,相比DeepSeek R1和R1-1776,在减少有害内容方面降低了50%风险。这说明MAI-DS-R1虽然能响应更多的敏感话题,但仍然还是在安全控制范围之内。
![]()
在推理能力方面,MAI-DS-R1保持了与DeepSeek R1相同的推理能力,在一般知识、推理、数学和编程基准测试中表现非常出色。
![]()
![]()
MAI-DS-R1在后训练过程中将问题翻译成多种语言,能够更好地适应不同语言环境下的需求。这使得MAI-DS-R1在需要多语言支持的领域,如国际组织、跨国企业、教育机构等,能够提供多语言的高质量回答。
目前,微软已经在huggingface开源了该模型,同时在Azure AI Foundry进行了发布。
huggingface地址:https://huggingface.co/microsoft/MAI-DS-R1
Azure地址:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml
更多游戏资讯请关注:电玩帮游戏资讯专区
电玩帮图文攻略 www.vgover.com
