OpenAI 更新 - o1
今天,OpenAI 更新了網頁版和 API 版的 o1,改進了代碼、數學等功能,這些改進也會反映到 o1 Pro 模式。
- o1 API 名稱:o1-2024-12-17
- 開放進度:o1 API 正從 Tier 5 逐步向下開放
- 上下文與輸出:具有 200K 上下文,100K 輸出
- 圖像輸入:支持輸入圖像,並輸出結構化數據
- 新參數:新增 o1 API 獨有參數 `reasoning_effort`,可以控制模型在回答前的思考時間。目前支持低、中、高三種程度。降低推理程度可以加快響應速度,並減少響應中用於推理的符號數量。
---
OpenAI 更新 - 偏好微調 - 直接偏好優化(DPO)
直接偏好優化(DPO)微調是一種基於提示和成對回應的方法,通過學習人類偏好來優化輸出,產生更受青睞的結果。目前僅支持文字 DPO 微調。
- DPO 微調所需數據集:
- 提示(例如用戶消息)
- 偏好輸出(理想的助手回應)
- 非偏好輸出(次佳的助手回應)
- 數據格式:使用 JSONL 格式,每行爲一個示例,包含 `input`(包含 `messages`、`tools`、`parallel_tool_calls`)、`preferred_output` 和 `non_preferred_output`。
- 限制:目前僅支持單輪對話,偏好和非偏好消息需爲最後的助手消息。
建議先使用監督式微調(SFT)在偏好回應子集上訓練模型,再使用 DPO 調整模型,可顯著提升模型對齊和性能。
---
OpenAI 更新 - 實時語音功能
- 模型更新
- 4o 語音價格降低 60%
- 4o mini 價格降低 90%
---
OpenAI 更新 - SDK
新的 Go 和 Java SDK 測試版已推出。
文檔鏈接:https://platform.openai.com/docs/libraries
---
OpenAI 12天直播發布回顧(想看之前的朋友可以去主頁,每天都有介紹)
OpenAI直播第1天:上線o1滿血版,推出200美刀的Pro會員
OpenAI直播第2天:強化微調
OpenAI直播第3天:Sora正式上線!
OpenAI直播第4天:ChatGPT Canvas更新
OpenAI直播第5天:ChatGPT和Apple
OpenAI直播第6天:高級語音模式-視頻通話
OpenAI直播第7天:發佈 Projects
OpenAI直播第8天:搜索功能更新
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com