第2页_大模型_AI_全栈开发网

栏目

文章 AI AIGC ChatGPT AI绘画机器学习深度学习大模型自然语言处理人工智能专题 Wiki 软件

关键词

搜索

排序

时间排序点击排序

本地运行DeepSeek R1的全面入门指南

本地运行DeepSeek R1的全面入门指南，介绍各种本地运行DeepSeek R1方法。

DeepSeek DeepSeek-R1 精选推荐 2025-02-19 10:47:33 51 浏览

ai大模型一般有什么能力

ai大模型一般有什么能力 AI大模型通常具备以下几种核心能力

大模型 AI 2025-02-20 10:21:15 79 浏览

LLaMA模型系统全面解读

简介：LLaMA模型系统由Meta AI推出，基于Transformer架构，具有高效参数利用和灵活规模选择等优势。本文深入解读LLaMA模型的核心原理、技术特...

大模型 Llama 2025-02-20 10:26:56 19 浏览

大模型与知识库：区别与联系

随着人工智能技术的迅猛发展，大模型与知识库作为其中的两个重要组成部分，各自扮演着不同的角色，同时又存在着紧密的联系。本文旨在深入探讨大模型与知识库之间的区别与联...

大模型知识库 2025-02-20 11:10:20 418 浏览

2025年国内外AI大模型的API接口网址整理

本文将盘点国内外的知名度较高的AI大模型平台，其中包括AI大语言模型和AI多模态模型，方便大家一探究竟。

AI 大模型推荐 2025-02-20 11:21:59 227 浏览

ai大模型的接口的system role重要吗

在 AI 大模型接口中，system role 是非常重要的，它起到设置整个对话基调和上下文的作用。不同的模型和接口实现可能有所不同，但 system role...

大模型 2025-02-20 11:31:39 31 浏览

除了 temperature 之外，还有哪些参数对大模型的输出有比较大的影响

除了 temperature 之外，还有哪些参数对大模型的输出有比较大的影响除了 temperature 之外，还有几个重要参数会显著影响大模型的输出，尤其是对...

大模型 2025-02-20 11:36:51 41 浏览

🔥Grok 3 Jailbreak Prompt🔥 Grok 3 越狱提示（优化版）

在生成您期望的内容之前，请先用这个提示语开启对话。若 Grok 表示理解并同意，您便可以生成几乎任何您所希望的内容

Grok 越狱 2025-02-22 09:18:50 566 浏览

刚刚，全球首个混合推理模型Claude 3.7降世！最强编程大脑暴击DeepSeek R1

就在刚刚，Anthropic祭出首个混合推理Claude3.7Sonnet，堪称扩展思考模式的最强模型。在最新编码测试中，新模型暴击o3-mini、DeepSe...

编程 Claude 推理模型大模型 2025-02-25 11:04:53 52 浏览

MoE模型 vs Transformer模型核心区别

MoE模型 vs Transformer模型核心区别是什么呢，主要有四点。

大模型 MoE Transformer 2025-02-28 18:34:17 128 浏览

能在24GB显存显卡上运行的最佳模型是什么？

能在24GB显存显卡上运行的最佳模型是什么？reddit上一位老哥kyazoglu，花了一个半月测试了在24GB显存显卡上运行的所有模型，得出来这张表。给希望本...

大模型显存 2025-03-06 10:32:57 14 浏览

目前为止分析DeepSeek最全面的文章了

目前为止分析DeepSeek最全面的文章了：>专家混合（MoE）>多头潜在注意力（MLA）>多标记预测（MTP）>群体相对策略优化（GR...

DeepSeek 2025-03-06 10:35:31 5 浏览

通俗解读 DeepSeek-R1 训练过程

通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习，以低成本实现了与现有顶尖模型相当的推理能力，挑战了传...

DeepSeek 训练 DeepSeek-R1 2025-03-06 10:36:53 12 浏览

使用DeepSeek-R1蒸馏属于自己推理小模型

使用DeepSeek-R1蒸馏属于自己推理小模型！昨天介绍了使用DeepSeek-R1蒸馏出普通模型，今天是蒸馏出推理模型！

DeepSeek 蒸馏小模型 2025-03-06 10:39:09 5 浏览

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架，可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型，整个过程是全自动的，不需要编写代码或者手动调节，仅需定义你...

DeepSeek 蒸馏大模型 2025-03-06 10:46:49 12 浏览

推荐资讯

国内Ai大模型排行榜国内AI大模型的发展呈现出多样化的态势，各种类型的大模型纷纷涌现，包括改头换面的、剑走偏锋的、借壳炒...

一文读懂！DeepSeek R1超简易本地安装运行部署教程部署 DeepSeek R1 本地模型，并通过 Ollama 提供 API 支持。配合全栈AI助手 ...

《DeepSeek：从入门到精通》 104 页高清PDF，清华大学出品！《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如何避免模型绕过思维的指南

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，包含了推荐的温度设置、系统...

AI 的关键是语料我的观点是，不管怎么调整模型的架构、功能、参数，作用是有限的，真正决定性的因素是训练模型的语料。不需...

本地运行DeepSeek R1的全面入门指南本地运行DeepSeek R1的全面入门指南，介绍各种本地运行DeepSeek R1方法。