o3-mini 模型选择思路|什么时候坚决不用 o3-mini,只用 o1 满血版?

未知
2025-03-06 10:41:20
0

o3-mini 模型选择思路|什么时候坚决不用 o3-mini,只用 o1 满血版?

o3-mini 模型选择思路|什么时候坚决不用 o3-mini,只用 o1 满血版?


在数学、编程等STEM 任务上,o3-mini-high 超越 o1;但是,在非 STEM 任务上,mini 系列的蒸馏模型,和o1 等满血模型,是没法比的。


O1 满血版,是“文科之王”:MMLU语言理解 benchmark,o1 得分 91.8分,稳居第一;人类专家的得分是89.8%;


而 o3-mini-high的 MMLU 只有 86.9 分;在openai 的 blog 文章中,o3-mini 都是对标o1 满血版的,除了general knowledge、非 STEM 任务这块。


推测:mini系列都是蒸馏版模型;优点是相对满血版模型,价格足够便宜(o3-mini 比 gpt-4o 还要便宜一半);缺点就是蒸馏模型的语言能力都相当“差”(用过 o1 这样的文科之王,就会“曾经沧海难为水”)。


结论:STEM 任务,用 o3-mini-high;非 STEM 任务,用 o1 满血版;二者的 plus 限额都是每周 50 次,合计有 100 次/周。

以上就是o3-mini 模型选择思路|什么时候坚决不用 o3-mini,只用 o1 满血版?的详细内容,更多请关注全栈开发网其它相关文章!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 service@p2hp.com 进行投诉反馈,一经查实,立即处理!
-- -- 0

上一篇:ChatGPT与人类思维的差异

下一篇:没有了

相关内容

阿里视频生成大模型万相2.1开源!效果超Sora,消费级显卡就能跑
阿里视频生成大模型万相2.1开源!效果超Sora,消费级显卡...
阿里云视频生成大模型万相2.1(Wan)正式开源,此次开源采用Apache2.0协议,14...
2025-03-08 10:38:06
阿里发布全新开源推理模型 QwQ-32B,其性能可与 DeepSeek-R1 媲美
阿里发布全新开源推理模型 QwQ-32B,其性能可与 Dee...
阿里云通义千问官方公众号发文宣布,推出最新的推理模型 QwQ-32B。一款拥有 320 亿...
2025-03-07 09:30:30
 Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型
Claude 3.7 Sonnet 是 Anthropic...
Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型,也是首个 C...
2025-03-06 11:00:24
如何用DeepSeek-R1蒸馏出属于你自己的大模型
如何用DeepSeek-R1蒸馏出属于你自己的大模型
发现了一个新的fune-tune框架,可以在1小时内让DeepSeek-R1蒸馏出属于你自...
2025-03-06 10:46:49
能在24GB显存显卡上运行的最佳模型是什么?
能在24GB显存显卡上运行的最佳模型是什么?
能在24GB显存显卡上运行的最佳模型是什么?reddit上一位老哥kyazoglu,花了一...
2025-03-06 10:32:57
💬 什么是ChatGPT ChatGPT 是一种由 OpenAI 开发的人工智能对话模型,基于 GPT 架构,能够自然地生成文...
ChatGPT与人类思维的差异 在这篇文章里我再进一步讲解人类的思维模式和LLM之间的差异,同时说明如何弥补LLM的“思维缺陷”从而...
ChatGPT API 相比 ChatGPT 的一些优点 ChatGPT API 相比 ChatGPT 的一些优点:显式定义角色,选择性地去掉会话中的信息,返...
🏋️‍♀️ ChatGPT是怎么被训练出来的 ChatGPT是怎么被训练出来的.ChatGPT的训练四阶段:阶段一:预训练(Pretraining...
o3-mini 模型选择思路|什么时候坚决不用 o3-mini,只用 o1 满血... o3-mini 模型选择思路|什么时候坚决不用 o3-mini,只用 o1 满血版?在数学、编程等S...

最新文章

o3-mini 模型选择思路|什么时候坚决不用 o3-mini,只用 o1 满血... o3-mini 模型选择思路|什么时候坚决不用 o3-mini,只用 o1 满血版?在数学、编程等S...
ChatGPT与人类思维的差异 在这篇文章里我再进一步讲解人类的思维模式和LLM之间的差异,同时说明如何弥补LLM的“思维缺陷”从而...
🏋️‍♀️ ChatGPT是怎么被训练出来的 ChatGPT是怎么被训练出来的.ChatGPT的训练四阶段:阶段一:预训练(Pretraining...
💬 什么是ChatGPT ChatGPT 是一种由 OpenAI 开发的人工智能对话模型,基于 GPT 架构,能够自然地生成文...
ChatGPT API 相比 ChatGPT 的一些优点 ChatGPT API 相比 ChatGPT 的一些优点:显式定义角色,选择性地去掉会话中的信息,返...