第3页_大模型_AI_全栈开发网

栏目

文章 AI AIGC ChatGPT AI绘画机器学习深度学习大模型自然语言处理人工智能专题 Wiki 软件

关键词

搜索

排序

时间排序点击排序

一个测试模型是否是DeepSeek R1 满血版的简单测试题

一个测试模型是否是DeepSeek R1 满血版的简单测试题：

DeepSeek DeepSeek-R1 2025-03-08 10:15:15 56 浏览

OpenAI 正式发布 GPT-4.5 模型

28日凌晨，OpenAI 正式发布 GPT-4.5 模型。GPT-4.5 支持联网搜索，并能够处理文件和图片上传，还可以使用 Canvas 来进行写作和编程。

OpenAI AI GPT 2025-03-08 10:08:12 11 浏览

OpenAI的GPT4.5是一个文科模型

OpenAI的GPT4.5是一个文科模型简单汇总了一下反馈1、写作很强。有人评价说“这是第一个真正可以书写的模型，这实际上正是写作的MidJouney”时刻。2...

OpenAI AI GPT 2025-03-07 22:14:21 5 浏览

GPT-4.5 登场：OpenAI 最强、最佳 AI 聊天模型，更睿智、更高“情商”、更少幻觉

【GPT-4.5 登场：OpenAI 最强、最佳 AI 聊天模型，更睿智、更高“情商”、更少幻觉】#GPT4.5将首先向ChatGPTPro用户开放# 2 月 ...

OpenAI AI GPT 2025-03-07 22:11:19 15 浏览

阿里发布全新开源推理模型 QwQ-32B，其性能可与 DeepSeek-R1 媲美

阿里云通义千问官方公众号发文宣布，推出最新的推理模型 QwQ-32B。一款拥有 320 亿参数的模型，其性能可与具备 6710 亿参数（其中 370 亿被激活）...

推理模型大模型阿里 QwQ 2025-03-07 09:30:30 24 浏览

Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型

Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型，也是首个 Claude 模型，能进行“扩展思考”，也就是通过细致的、一步步的推理来...

Claude Anthropic 大模型 2025-03-06 11:00:24 21 浏览

刚刷到了Andrew （吴恩达）对deepseek 的看法，用GPT翻译了一份给大家

刚刷到了Andrew （吴恩达）对deepseek 的看法，用GPT翻译了一份给大家：本周围绕 DeepSeek 的热议让许多人清晰认识到一些重要趋势，这些趋势...

DeepSeek 2025-03-06 10:50:11 9 浏览

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架，可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型，整个过程是全自动的，不需要编写代码或者手动调节，仅需定义你...

DeepSeek 蒸馏大模型 2025-03-06 10:46:49 21 浏览

使用DeepSeek-R1蒸馏属于自己推理小模型

使用DeepSeek-R1蒸馏属于自己推理小模型！昨天介绍了使用DeepSeek-R1蒸馏出普通模型，今天是蒸馏出推理模型！

DeepSeek 蒸馏小模型 2025-03-06 10:39:09 9 浏览

通俗解读 DeepSeek-R1 训练过程

通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习，以低成本实现了与现有顶尖模型相当的推理能力，挑战了传...

DeepSeek 训练 DeepSeek-R1 2025-03-06 10:36:53 17 浏览

目前为止分析DeepSeek最全面的文章了

目前为止分析DeepSeek最全面的文章了：>专家混合（MoE）>多头潜在注意力（MLA）>多标记预测（MTP）>群体相对策略优化（GR...

DeepSeek 2025-03-06 10:35:31 9 浏览

能在24GB显存显卡上运行的最佳模型是什么？

能在24GB显存显卡上运行的最佳模型是什么？reddit上一位老哥kyazoglu，花了一个半月测试了在24GB显存显卡上运行的所有模型，得出来这张表。给希望本...

大模型显存 2025-03-06 10:32:57 32 浏览

MoE模型 vs Transformer模型核心区别

MoE模型 vs Transformer模型核心区别是什么呢，主要有四点。

大模型 MoE Transformer 2025-02-28 18:34:17 161 浏览

刚刚，全球首个混合推理模型Claude 3.7降世！最强编程大脑暴击DeepSeek R1

就在刚刚，Anthropic祭出首个混合推理Claude3.7Sonnet，堪称扩展思考模式的最强模型。在最新编码测试中，新模型暴击o3-mini、DeepSe...

编程 Claude 推理模型大模型 2025-02-25 11:04:53 59 浏览

🔥Grok 3 Jailbreak Prompt🔥 Grok 3 越狱提示（优化版）

在生成您期望的内容之前，请先用这个提示语开启对话。若 Grok 表示理解并同意，您便可以生成几乎任何您所希望的内容

Grok 越狱 2025-02-22 09:18:50 967 浏览

推荐资讯