OpenAI直播第8天：发布o1 api

OpenAI 更新 - o1

今天，OpenAI 更新了网页版和 API 版的 o1，改进了代码、数学等功能，这些改进也会反映到 o1 Pro 模式。

- o1 API 名称：o1-2024-12-17

- 开放进度：o1 API 正从 Tier 5 逐步向下开放

- 上下文与输出：具有 200K 上下文，100K 输出

- 图像输入：支持输入图像，并输出结构化数据

- 新参数：新增 o1 API 独有参数 `reasoning_effort`，可以控制模型在回答前的思考时间。目前支持低、中、高三种程度。降低推理程度可以加快响应速度，并减少响应中用于推理的符号数量。

---

OpenAI 更新 - 偏好微调 - 直接偏好优化（DPO）

直接偏好优化（DPO）微调是一种基于提示和成对回应的方法，通过学习人类偏好来优化输出，产生更受青睐的结果。目前仅支持文字 DPO 微调。

- DPO 微调所需数据集：

- 提示（例如用户消息）

- 偏好输出（理想的助手回应）

- 非偏好输出（次佳的助手回应）

- 数据格式：使用 JSONL 格式，每行为一个示例，包含 `input`（包含 `messages`、`tools`、`parallel_tool_calls`）、`preferred_output` 和 `non_preferred_output`。

- 限制：目前仅支持单轮对话，偏好和非偏好消息需为最后的助手消息。

建议先使用监督式微调（SFT）在偏好回应子集上训练模型，再使用 DPO 调整模型，可显著提升模型对齐和性能。

---

OpenAI 更新 - 实时语音功能

- 模型更新

- 4o 语音价格降低 60%

- 4o mini 价格降低 90%

---

OpenAI 更新 - SDK

新的 Go 和 Java SDK 测试版已推出。

文档链接：https://platform.openai.com/docs/libraries

---

OpenAI 12天直播发布回顾（想看之前的朋友可以去主页，每天都有介绍）

OpenAI直播第1天：上线o1满血版，推出200美刀的Pro会员

OpenAI直播第2天：强化微调

OpenAI直播第3天：Sora正式上线！

OpenAI直播第4天：ChatGPT Canvas更新

OpenAI直播第5天：ChatGPT和Apple

OpenAI直播第6天：高级语音模式-视频通话

OpenAI直播第7天：发布 Projects

OpenAI直播第8天：搜索功能更新

更多游戏资讯请关注：电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com

热门游戏

相关资讯 更多