OpenAI直播第8天：發佈o1 api

OpenAI 更新 - o1

今天，OpenAI 更新了網頁版和 API 版的 o1，改進了代碼、數學等功能，這些改進也會反映到 o1 Pro 模式。

- o1 API 名稱：o1-2024-12-17

- 開放進度：o1 API 正從 Tier 5 逐步向下開放

- 上下文與輸出：具有 200K 上下文，100K 輸出

- 圖像輸入：支持輸入圖像，並輸出結構化數據

- 新參數：新增 o1 API 獨有參數 `reasoning_effort`，可以控制模型在回答前的思考時間。目前支持低、中、高三種程度。降低推理程度可以加快響應速度，並減少響應中用於推理的符號數量。

---

OpenAI 更新 - 偏好微調 - 直接偏好優化（DPO）

直接偏好優化（DPO）微調是一種基於提示和成對回應的方法，通過學習人類偏好來優化輸出，產生更受青睞的結果。目前僅支持文字 DPO 微調。

- DPO 微調所需數據集：

- 提示（例如用戶消息）

- 偏好輸出（理想的助手回應）

- 非偏好輸出（次佳的助手回應）

- 數據格式：使用 JSONL 格式，每行爲一個示例，包含 `input`（包含 `messages`、`tools`、`parallel_tool_calls`）、`preferred_output` 和 `non_preferred_output`。

- 限制：目前僅支持單輪對話，偏好和非偏好消息需爲最後的助手消息。

建議先使用監督式微調（SFT）在偏好回應子集上訓練模型，再使用 DPO 調整模型，可顯著提升模型對齊和性能。

---

OpenAI 更新 - 實時語音功能

- 模型更新

- 4o 語音價格降低 60%

- 4o mini 價格降低 90%

---

OpenAI 更新 - SDK

新的 Go 和 Java SDK 測試版已推出。

文檔鏈接：https://platform.openai.com/docs/libraries

---

OpenAI 12天直播發布回顧（想看之前的朋友可以去主頁，每天都有介紹）

OpenAI直播第1天：上線o1滿血版，推出200美刀的Pro會員

OpenAI直播第2天：強化微調

OpenAI直播第3天：Sora正式上線！

OpenAI直播第4天：ChatGPT Canvas更新

OpenAI直播第5天：ChatGPT和Apple

OpenAI直播第6天：高級語音模式-視頻通話

OpenAI直播第7天：發佈 Projects

OpenAI直播第8天：搜索功能更新

更多遊戲資訊請關註：電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com

热门游戏

相關資訊 更多