OpenAI直播第8天:发布o1 api

OpenAI 更新 - o1

 

今天,OpenAI 更新了网页版和 API 版的 o1,改进了代码、数学等功能,这些改进也会反映到 o1 Pro 模式。

 

- o1 API 名称:o1-2024-12-17  

- 开放进度:o1 API 正从 Tier 5 逐步向下开放  

- 上下文与输出:具有 200K 上下文,100K 输出  

- 图像输入:支持输入图像,并输出结构化数据  

- 新参数:新增 o1 API 独有参数 `reasoning_effort`,可以控制模型在回答前的思考时间。目前支持低、中、高三种程度。降低推理程度可以加快响应速度,并减少响应中用于推理的符号数量。

 

---

 

OpenAI 更新 - 偏好微调 - 直接偏好优化(DPO)

 

直接偏好优化(DPO)微调是一种基于提示和成对回应的方法,通过学习人类偏好来优化输出,产生更受青睐的结果。目前仅支持文字 DPO 微调。

 

- DPO 微调所需数据集:  

  - 提示(例如用户消息)  

  - 偏好输出(理想的助手回应)  

  - 非偏好输出(次佳的助手回应)  

- 数据格式:使用 JSONL 格式,每行为一个示例,包含 `input`(包含 `messages`、`tools`、`parallel_tool_calls`)、`preferred_output` 和 `non_preferred_output`。  

- 限制:目前仅支持单轮对话,偏好和非偏好消息需为最后的助手消息。  

 

建议先使用监督式微调(SFT)在偏好回应子集上训练模型,再使用 DPO 调整模型,可显著提升模型对齐和性能。

 

---

 

OpenAI 更新 - 实时语音功能  

 

- 模型更新  

- 4o 语音价格降低 60%  

- 4o mini 价格降低 90%

 

---

 

OpenAI 更新 - SDK

 

新的 Go 和 Java SDK 测试版已推出。  

文档链接:https://platform.openai.com/docs/libraries

 

---

OpenAI 12天直播发布回顾(想看之前的朋友可以去主页,每天都有介绍)

OpenAI直播第1天:上线o1满血版,推出200美刀的Pro会员

OpenAI直播第2天:强化微调

OpenAI直播第3天:Sora正式上线!

OpenAI直播第4天:ChatGPT Canvas更新

OpenAI直播第5天:ChatGPT和Apple

OpenAI直播第6天:高级语音模式-视频通话

OpenAI直播第7天:发布 Projects

OpenAI直播第8天:搜索功能更新

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com