最新文章第6页_全栈开发网

技术炒作三十年，过去的三十年都发生了哪些技术炒作？

大家有没有发现，每隔一段时间，媒体就会大肆炒作一种新技术，宣扬它将对人类产生巨大影响，全社会都在关注，人人都在谈论。一个国外程序员根据回忆，列出了过去三十年主要...

技术炒作 2025-03-07 09:41:15 8 浏览

阿里发布全新开源推理模型 QwQ-32B，其性能可与 DeepSeek-R1 媲美

阿里云通义千问官方公众号发文宣布，推出最新的推理模型 QwQ-32B。一款拥有 320 亿参数的模型，其性能可与具备 6710 亿参数（其中 370 亿被激活）...

推理模型大模型阿里 QwQ 2025-03-07 09:30:30 22 浏览

全球首发！中国团队推出革命性通用AI Agent：Manus

Manus（官网：https://manus.im/）是一款由中国团队开发的人工智能产品，被称为全球首款通用型AI Agent。它于2025年3月5日正式亮相，...

Manus AI Agent 2025-03-06 13:23:12 1183 浏览

Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型

Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型，也是首个 Claude 模型，能进行“扩展思考”，也就是通过细致的、一步步的推理来...

Claude Anthropic 大模型 2025-03-06 11:00:24 13 浏览

医护人员，Deepseek使用指南！

DeepSeek 2025-03-06 10:54:26 7 浏览

刚刷到了Andrew （吴恩达）对deepseek 的看法，用GPT翻译了一份给大家

刚刷到了Andrew （吴恩达）对deepseek 的看法，用GPT翻译了一份给大家：本周围绕 DeepSeek 的热议让许多人清晰认识到一些重要趋势，这些趋势...

DeepSeek 2025-03-06 10:50:11 6 浏览

OpenAI 模型超过普通人平均智商。

OpenAI 模型超过普通人平均智商。刚看到一个智商评估数据，说O3 Mini的智商在115-120这个区间。而普通人的智商（IQ）通常以100为平均值，标准差...

OpenAI AI 2025-03-06 10:48:07 4 浏览

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架，可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型，整个过程是全自动的，不需要编写代码或者手动调节，仅需定义你...

DeepSeek 蒸馏大模型 2025-03-06 10:46:49 10 浏览

o3-mini 模型选择思路｜什么时候坚决不用 o3-mini，只用 o1 满血版？

o3-mini 模型选择思路｜什么时候坚决不用 o3-mini，只用 o1 满血版？在数学、编程等STEM 任务上，o3-mini-high 超越 o1；但是，...

大模型 2025-03-06 10:41:20 12 浏览

使用DeepSeek-R1蒸馏属于自己推理小模型

使用DeepSeek-R1蒸馏属于自己推理小模型！昨天介绍了使用DeepSeek-R1蒸馏出普通模型，今天是蒸馏出推理模型！

DeepSeek 蒸馏小模型 2025-03-06 10:39:09 5 浏览

通俗解读 DeepSeek-R1 训练过程

通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习，以低成本实现了与现有顶尖模型相当的推理能力，挑战了传...

DeepSeek 训练 DeepSeek-R1 2025-03-06 10:36:53 11 浏览

目前为止分析DeepSeek最全面的文章了

目前为止分析DeepSeek最全面的文章了：>专家混合（MoE）>多头潜在注意力（MLA）>多标记预测（MTP）>群体相对策略优化（GR...

DeepSeek 2025-03-06 10:35:31 4 浏览

能在24GB显存显卡上运行的最佳模型是什么？

能在24GB显存显卡上运行的最佳模型是什么？reddit上一位老哥kyazoglu，花了一个半月测试了在24GB显存显卡上运行的所有模型，得出来这张表。给希望本...

大模型显存 2025-03-06 10:32:57 12 浏览

MoE模型 vs Transformer模型核心区别

MoE模型 vs Transformer模型核心区别是什么呢，主要有四点。

大模型 MoE Transformer 2025-02-28 18:34:17 121 浏览

代币是什么

现在，媒体经常出现一个词"代币"（token），今天就来谈谈这是什么？首先声明，代币属于加密货币，有交易市场。我完全不想碰这一块，只想谈谈它...

代币 token 2025-02-28 15:08:42 11 浏览

推荐资讯

PHP老矣，尚能饭否？近日 GitHut 最新公布的数据显示，开发者在 GitHub 提交的 PR 中，所使用语言为 PH...

国内Ai大模型排行榜国内AI大模型的发展呈现出多样化的态势，各种类型的大模型纷纷涌现，包括改头换面的、剑走偏锋的、借壳炒...

什么是全栈开发人员：所需的基本技能当您使用应用程序时，您通常认为谁负责？我相信您会考虑web开发人员。尽管您部分正确，但全栈开发人员是...

为什么 Laravel 这么优秀 Laravel 一直是我心中最优雅的后端框架，为了向更多的人解释为什么 Laravel 这么优雅？框...

微信小程序学习笔记，知识点全面概括总结微信小程序学习笔记，知识点全面概括总结

MySQL安全最佳实践指南（2024版）由于存储着敏感数据，MySQL数据库正沦为网络罪犯的攻击目标。这份全面的安全指南将深入研究保护MyS...

一文读懂！DeepSeek R1超简易本地安装运行部署教程部署 DeepSeek R1 本地模型，并通过 Ollama 提供 API 支持。配合全栈AI助手 ...

《DeepSeek：从入门到精通》 104 页高清PDF，清华大学出品！《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如何避免模型绕过思维的指南

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，包含了推荐的温度设置、系统...

2024年技术发展趋势展望2024年，许多科技领导者和观察人士表示，人工智能仍将主导对话和企业计划。然而，重点不仅在于其扩...