DeepSeek

关键词
通俗解读 DeepSeek-R1 训练过程

通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习,以低成本实现了与现有顶尖模型相当的推理能力,挑战了传...

Deepseek-v3技术报告简报

Deepseek-v3技术报告简报。大家知道,硅谷的某几个前沿闭源模型公司,对外分享的技术信息越来越少了,报告里谈细节也是语焉不详。但是这次Deepseek-v...

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架,可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型,整个过程是全自动的,不需要编写代码或者手动调节,仅需定义你...

一个讲解如何从头开始构建 DeepSeek R1的项目

开发者Fareed Khan's 用手绘流程图以及代码的方式,逐步讲解如何按照 deepseek 技术报告构建一个可以在本地运行的小型基础模型。非常详...

DeepSeek R1 系统提示词

DeepSeek R1 系统提示词:您是由中国公司深度求索(DeepSeek)独家开发的智能助手DeepSeek-R1。您将为用户提供有益、无害且详尽的回答。关...

中国Deepseek为何震惊了国内外,特别是美国人?

中国Deepseek为何震惊了国内外,特别是美国人?

医护人员,Deepseek使用指南!

医护人员,Deepseek使用指南!

刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家

刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家:本周围绕 DeepSeek 的热议让许多人清晰认识到一些重要趋势,这些趋势...

使用DeepSeek-R1蒸馏属于自己推理小模型

使用DeepSeek-R1蒸馏属于自己推理小模型!昨天介绍了使用DeepSeek-R1蒸馏出普通模型,今天是蒸馏出推理模型!

目前为止分析DeepSeek最全面的文章了

目前为止分析DeepSeek最全面的文章了:>专家混合(MoE)>多头潜在注意力(MLA)>多标记预测(MTP)>群体相对策略优化(GR...

推荐资讯

国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​ 《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...
DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统...
AI 的关键是语料 我的观点是,不管怎么调整模型的架构、功能、参数,作用是有限的,真正决定性的因素是训练模型的语料。不需...
Sora到底是如何工作的 现在有众多关于这个最重要的视频模型的不实信息。幸好,我们没必要乱加推测。
本地运行DeepSeek R1的全面入门指南 本地运行DeepSeek R1的全面入门指南,介绍各种本地运行DeepSeek R1方法。
AI大模型的Prompt提示词如何写?三种框架介绍 AI大模型的Prompt提示词如何写,分为三种提示框架,Basic Prompt Framework...
歸藏老师的文本转可视化网页Prompt 歸藏老师的文本转可视化网页Prompt,可以把任何文本转化为精美网页。
AI画图(AI绘画):文生图提示词(prompt)教学 AI画图(AI绘画):文生图提示词(prompt)教学 提 示 词 (Promp0 是 一 种 用 ...