第2页_Deepseek_全栈开发网

DeepSeek

栏目

文章后端前端专题数据库服务器运维开发工具移动开发 web开发 AI 云计算开源软件开发大数据建站编程操作系统架构物联网音视频安全网页设计游戏开发网络与通信科技电脑教程硬件教程手机教程游戏教程 linux CMS教程应用软件程序员求职面试编程语言技术趋势测试 UE/UI IT资讯自媒体运营营销/推广互联网创业其它系统教程硬件开发 Wiki 软件

关键词

搜索

排序

时间排序点击排序

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架，可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型，整个过程是全自动的，不需要编写代码或者手动调节，仅需定义你...

DeepSeek 蒸馏大模型 2025-03-06 10:46:49 19 浏览

使用DeepSeek-R1蒸馏属于自己推理小模型

使用DeepSeek-R1蒸馏属于自己推理小模型！昨天介绍了使用DeepSeek-R1蒸馏出普通模型，今天是蒸馏出推理模型！

DeepSeek 蒸馏小模型 2025-03-06 10:39:09 7 浏览

通俗解读 DeepSeek-R1 训练过程

通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习，以低成本实现了与现有顶尖模型相当的推理能力，挑战了传...

DeepSeek 训练 DeepSeek-R1 2025-03-06 10:36:53 16 浏览

目前为止分析DeepSeek最全面的文章了

目前为止分析DeepSeek最全面的文章了：>专家混合（MoE）>多头潜在注意力（MLA）>多标记预测（MTP）>群体相对策略优化（GR...

DeepSeek 2025-03-06 10:35:31 9 浏览

刚刚，全球首个混合推理模型Claude 3.7降世！最强编程大脑暴击DeepSeek R1

就在刚刚，Anthropic祭出首个混合推理Claude3.7Sonnet，堪称扩展思考模式的最强模型。在最新编码测试中，新模型暴击o3-mini、DeepSe...

编程 Claude 推理模型大模型 2025-02-25 11:04:53 57 浏览

本地运行DeepSeek R1的全面入门指南

本地运行DeepSeek R1的全面入门指南，介绍各种本地运行DeepSeek R1方法。

DeepSeek DeepSeek-R1 精选推荐 2025-02-19 10:47:33 54 浏览

一文图解 DeepSeek-R1 的出众推理能力从何而来？

今天这篇深度解析 DeepSeek-R1 训练方法的文章，将展示一个令人耳目一新的解决方案：如何通过创新的强化学习方法，在少量高质量人工标注数据的情况下，打造出...

DeepSeek 2025-02-19 10:24:17 162 浏览

DeepSeek创始人梁文锋是个什么样的人？

梁文峰的成长经历与投资之路1. 出生背景和早期经历梁文峰，1985年出生于广东省湛江市吴川市覃巴镇米历岭村，家境普通，父母都是小学语文老师，并无显赫背景。他主要...

DeepSeek 梁文锋 2025-02-18 17:29:20 170 浏览

一文读懂！DeepSeek R1超简易本地安装运行部署教程

部署 DeepSeek R1 本地模型，并通过 Ollama 提供 API 支持。配合全栈AI助手接入本地部署DeepSeek-R1模型API接口，提升用户体...

DeepSeek Ollama 精选推荐 2025-02-18 15:14:37 224 浏览

老妈都能玩转的 deepseek 教程

其实还有很多人没用过大模型，就算不说老人小孩，成年人要是对新事物不太感冒，可能都没有用过。考虑到这点，写个教程，尽可能简单，也足够有趣，让老妈都能玩转 deep...

deepSeek 2025-02-18 14:38:04 27 浏览

《DeepSeek：从入门到精通》 104 页高清PDF，清华大学出品！

《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后及其团队撰写。文档的核心内容围绕DeepSeek的...

DeepSeek 精选推荐 2025-02-17 14:13:20 285 浏览

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如何避免模型绕过思维的指南

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，包含了推荐的温度设置、系统提示建议，以及相关的官方文档链接。

DeepSeek DeepSeek-R1 精选推荐 2025-02-16 11:33:25 183 浏览

推荐资讯

PHP老矣，尚能饭否？近日 GitHut 最新公布的数据显示，开发者在 GitHub 提交的 PR 中，所使用语言为 PH...

国内Ai大模型排行榜国内AI大模型的发展呈现出多样化的态势，各种类型的大模型纷纷涌现，包括改头换面的、剑走偏锋的、借壳炒...

什么是全栈开发人员：所需的基本技能当您使用应用程序时，您通常认为谁负责？我相信您会考虑web开发人员。尽管您部分正确，但全栈开发人员是...

为什么 Laravel 这么优秀 Laravel 一直是我心中最优雅的后端框架，为了向更多的人解释为什么 Laravel 这么优雅？框...

微信小程序学习笔记，知识点全面概括总结微信小程序学习笔记，知识点全面概括总结

《DeepSeek：从入门到精通》 104 页高清PDF，清华大学出品！《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...

MySQL安全最佳实践指南（2024版）由于存储着敏感数据，MySQL数据库正沦为网络罪犯的攻击目标。这份全面的安全指南将深入研究保护MyS...

一文读懂！DeepSeek R1超简易本地安装运行部署教程部署 DeepSeek R1 本地模型，并通过 Ollama 提供 API 支持。配合全栈AI助手 ...

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，包含了推荐的温度设置、系统...

2024年技术发展趋势展望2024年，许多科技领导者和观察人士表示，人工智能仍将主导对话和企业计划。然而，重点不仅在于其扩...