OpenAI 更新 - o1
今天,OpenAI 更新了网页版和 API 版的 o1,改进了代码、数学等功能,这些改进也会反映到 o1 Pro 模式。
- o1 API 名称:o1-2024-12-17
- 开放进度:o1 API 正从 Tier 5 逐步向下开放
- 上下文与输出:具有 200K 上下文,100K 输出
- 图像输入:支持输入图像,并输出结构化数据
- 新参数:新增 o1 API 独有参数 `reasoning_effort`,可以控制模型在回答前的思考时间。目前支持低、中、高三种程度。降低推理程度可以加快响应速度,并减少响应中用于推理的符号数量。
---
OpenAI 更新 - 偏好微调 - 直接偏好优化(DPO)
直接偏好优化(DPO)微调是一种基于提示和成对回应的方法,通过学习人类偏好来优化输出,产生更受青睐的结果。目前仅支持文字 DPO 微调。
- DPO 微调所需数据集:
- 提示(例如用户消息)
- 偏好输出(理想的助手回应)
- 非偏好输出(次佳的助手回应)
- 数据格式:使用 JSONL 格式,每行为一个示例,包含 `input`(包含 `messages`、`tools`、`parallel_tool_calls`)、`preferred_output` 和 `non_preferred_output`。
- 限制:目前仅支持单轮对话,偏好和非偏好消息需为最后的助手消息。
建议先使用监督式微调(SFT)在偏好回应子集上训练模型,再使用 DPO 调整模型,可显著提升模型对齐和性能。
---
OpenAI 更新 - 实时语音功能
- 模型更新
- 4o 语音价格降低 60%
- 4o mini 价格降低 90%
---
OpenAI 更新 - SDK
新的 Go 和 Java SDK 测试版已推出。
文档链接:https://platform.openai.com/docs/libraries
---
OpenAI 12天直播发布回顾(想看之前的朋友可以去主页,每天都有介绍)
OpenAI直播第1天:上线o1满血版,推出200美刀的Pro会员
OpenAI直播第2天:强化微调
OpenAI直播第3天:Sora正式上线!
OpenAI直播第4天:ChatGPT Canvas更新
OpenAI直播第5天:ChatGPT和Apple
OpenAI直播第6天:高级语音模式-视频通话
OpenAI直播第7天:发布 Projects
OpenAI直播第8天:搜索功能更新
更多游戏资讯请关注:电玩帮游戏资讯专区
电玩帮图文攻略 www.vgover.com