DeepSeek

关键词
超越DeepSeek R1与GPT 4.5,百度周末两连发!文心大模型4.5及X1,免费!

超越DeepSeek R1与GPT 4.5,百度周末两连发!文心大模型4.5及X1,免费!3月16日,文心大模型4.5和文心大模型X1正式发布!同时,文心大模型...

一个测试模型是否是DeepSeek R1 满血版的简单测试题

一个测试模型是否是DeepSeek R1 满血版的简单测试题:

通俗解读 DeepSeek-R1 训练过程

通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习,以低成本实现了与现有顶尖模型相当的推理能力,挑战了传...

一个讲解如何从头开始构建 DeepSeek R1的项目

开发者Fareed Khan's 用手绘流程图以及代码的方式,逐步讲解如何按照 deepseek 技术报告构建一个可以在本地运行的小型基础模型。非常详...

DeepSeek R1 系统提示词

DeepSeek R1 系统提示词:您是由中国公司深度求索(DeepSeek)独家开发的智能助手DeepSeek-R1。您将为用户提供有益、无害且详尽的回答。关...

Deepseek-v3技术报告简报

Deepseek-v3技术报告简报。大家知道,硅谷的某几个前沿闭源模型公司,对外分享的技术信息越来越少了,报告里谈细节也是语焉不详。但是这次Deepseek-v...

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架,可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型,整个过程是全自动的,不需要编写代码或者手动调节,仅需定义你...

中国Deepseek为何震惊了国内外,特别是美国人?

中国Deepseek为何震惊了国内外,特别是美国人?

医护人员,Deepseek使用指南!

医护人员,Deepseek使用指南!

刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家

刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家:本周围绕 DeepSeek 的热议让许多人清晰认识到一些重要趋势,这些趋势...

使用DeepSeek-R1蒸馏属于自己推理小模型

使用DeepSeek-R1蒸馏属于自己推理小模型!昨天介绍了使用DeepSeek-R1蒸馏出普通模型,今天是蒸馏出推理模型!

目前为止分析DeepSeek最全面的文章了

目前为止分析DeepSeek最全面的文章了:>专家混合(MoE)>多头潜在注意力(MLA)>多标记预测(MTP)>群体相对策略优化(GR...

推荐资讯

PHP老矣,尚能饭否? 近日 GitHut 最新公布的数据显示,开发者在 GitHub 提交的 PR 中,所使用语言为 PH...
国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
什么是全栈开发人员:所需的基本技能 当您使用应用程序时,您通常认为谁负责?我相信您会考虑web开发人员。尽管您部分正确,但全栈开发人员是...
为什么 Laravel 这么优秀 Laravel 一直是我心中最优雅的后端框架,为了向更多的人解释为什么 Laravel 这么优雅?框...
微信小程序学习笔记,知识点全面概括总结 微信小程序学习笔记,知识点全面概括总结
MySQL安全最佳实践指南(2024版) 由于存储着敏感数据,MySQL数据库正沦为网络罪犯的攻击目标。这份全面的安全指南将深入研究保护MyS...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​ 《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...
DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统...
2024年技术发展趋势 展望2024年,许多科技领导者和观察人士表示,人工智能仍将主导对话和企业计划。然而,重点不仅在于其扩...