OpenAI直播第8天:發佈o1 api

OpenAI 更新 - o1

 

今天,OpenAI 更新了網頁版和 API 版的 o1,改進了代碼、數學等功能,這些改進也會反映到 o1 Pro 模式。

 

- o1 API 名稱:o1-2024-12-17  

- 開放進度:o1 API 正從 Tier 5 逐步向下開放  

- 上下文與輸出:具有 200K 上下文,100K 輸出  

- 圖像輸入:支持輸入圖像,並輸出結構化數據  

- 新參數:新增 o1 API 獨有參數 `reasoning_effort`,可以控制模型在回答前的思考時間。目前支持低、中、高三種程度。降低推理程度可以加快響應速度,並減少響應中用於推理的符號數量。

 

---

 

OpenAI 更新 - 偏好微調 - 直接偏好優化(DPO)

 

直接偏好優化(DPO)微調是一種基於提示和成對回應的方法,通過學習人類偏好來優化輸出,產生更受青睞的結果。目前僅支持文字 DPO 微調。

 

- DPO 微調所需數據集:  

  - 提示(例如用戶消息)  

  - 偏好輸出(理想的助手回應)  

  - 非偏好輸出(次佳的助手回應)  

- 數據格式:使用 JSONL 格式,每行爲一個示例,包含 `input`(包含 `messages`、`tools`、`parallel_tool_calls`)、`preferred_output` 和 `non_preferred_output`。  

- 限制:目前僅支持單輪對話,偏好和非偏好消息需爲最後的助手消息。  

 

建議先使用監督式微調(SFT)在偏好回應子集上訓練模型,再使用 DPO 調整模型,可顯著提升模型對齊和性能。

 

---

 

OpenAI 更新 - 實時語音功能  

 

- 模型更新  

- 4o 語音價格降低 60%  

- 4o mini 價格降低 90%

 

---

 

OpenAI 更新 - SDK

 

新的 Go 和 Java SDK 測試版已推出。  

文檔鏈接:https://platform.openai.com/docs/libraries

 

---

OpenAI 12天直播發布回顧(想看之前的朋友可以去主頁,每天都有介紹)

OpenAI直播第1天:上線o1滿血版,推出200美刀的Pro會員

OpenAI直播第2天:強化微調

OpenAI直播第3天:Sora正式上線!

OpenAI直播第4天:ChatGPT Canvas更新

OpenAI直播第5天:ChatGPT和Apple

OpenAI直播第6天:高級語音模式-視頻通話

OpenAI直播第7天:發佈 Projects

OpenAI直播第8天:搜索功能更新

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com