o3-mini 模型选择思路｜什么时候坚决不用 o3-mini，只用 o1 满血版？

未知

2025-03-06 10:41:20

在数学、编程等STEM 任务上，o3-mini-high 超越 o1；但是，在非 STEM 任务上，mini 系列的蒸馏模型，和o1 等满血模型，是没法比的。

O1 满血版，是“文科之王”：MMLU语言理解 benchmark，o1 得分 91.8分，稳居第一；人类专家的得分是89.8%；

而 o3-mini-high的 MMLU 只有 86.9 分；在openai 的 blog 文章中，o3-mini 都是对标o1 满血版的，除了general knowledge、非 STEM 任务这块。

推测：mini系列都是蒸馏版模型；优点是相对满血版模型，价格足够便宜（o3-mini 比 gpt-4o 还要便宜一半）；缺点就是蒸馏模型的语言能力都相当“差”（用过 o1 这样的文科之王，就会“曾经沧海难为水”）。

结论：STEM 任务，用 o3-mini-high；非 STEM 任务，用 o1 满血版；二者的 plus 限额都是每周 50 次，合计有 100 次/周。

以上就是o3-mini 模型选择思路｜什么时候坚决不用 o3-mini，只用 o1 满血版？的详细内容，更多请关注全栈开发网其它相关文章！

大模型

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请将相关资料发送至 service@p2hp.com 进行投诉反馈，一经查实，立即处理!

-- -- 0

下一篇：没有了

推荐谷歌搜索插件、exa search api和firecrawl搜索API工具。exa提...

2025-03-22 09:56:42

据「中国信通院」公众号消息，中国信息通信研究院人工智能所基于前期的 AI Safety B...

2025-03-20 10:32:23

大模型的上下文窗口大小是什么在中文语境中，“大模型的上下文窗口大小”指的是大型语言模型（如...

2025-03-20 10:13:19

网友分享的在不同任务场景选择的最佳模型：

2025-03-18 13:35:01

AI大模型的Prompt提示词如何写,分为三种提示框架，Basic Prompt Fram...

2025-03-18 09:14:48

个人单机本地部署大模型，一步到位、两三年内不过时的话设备怎么选，最近周围朋友这方面聊得比较...

2025-03-17 16:16:25

💬 什么是ChatGPT ChatGPT 是一种由 OpenAI 开发的人工智能对话模型，基于 GPT 架构，能够自然地生成文...

o3-mini 模型选择思路｜什么时候坚决不用 o3-mini，只用 o1 满血... o3-mini 模型选择思路｜什么时候坚决不用 o3-mini，只用 o1 满血版？在数学、编程等S...

ChatGPT API 相比 ChatGPT 的一些优点 ChatGPT API 相比 ChatGPT 的一些优点：显式定义角色，选择性地去掉会话中的信息，返...

🏋️‍♀️ ChatGPT是怎么被训练出来的 ChatGPT是怎么被训练出来的.ChatGPT的训练四阶段：阶段一：预训练（Pretraining...

ChatGPT与人类思维的差异在这篇文章里我再进一步讲解人类的思维模式和LLM之间的差异，同时说明如何弥补LLM的“思维缺陷”从而...