关键词
2023 年度 AI 大事记

2023 年度 AI 大事记,记录了 2023 年人工智能的重要时间线(1 月至 12 月)

AI 的关键是语料

我的观点是,不管怎么调整模型的架构、功能、参数,作用是有限的,真正决定性的因素是训练模型的语料。不需要说,你的模型多新颖、多强大,只需要告诉我,你用什么语料训练...

国内Ai大模型排行榜

国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒作的以及有点内涵的。这些大模型在技术能力、应用场景和商业模式...

大模型的Tokens是什么

大模型中的"tokens"指的是模型处理的输入文本中的单词、标点符号或其他文本单元。

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如何避免模型绕过思维的指南

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统提示建议,以及相关的官方文档链接。

一文读懂!DeepSeek R1超简易本地安装运行部署教程

部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 接入本地部署DeepSeek-R1模型API接口,提升用户体...

《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​

《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余梦珑博士后及其团队撰写。文档的核心内容围绕DeepSeek的...

一文看懂小模型与端侧模型

“小模型”通常指的是那些参数规模远少于GPT-3或Llama-13B的大语言模型,几个具有代表性的参数为1.5B、3B、7B等。“端侧模型”则通常指的是部署在手...

什么是模型蒸馏

模型被问的最多的一类问题是:“你是什么模型?你的开发者是谁?”,然而你有时候并不能得到准确的答案,很多模型会自称是 GPT-4 或者 Claude,但实际上它们...

老妈都能玩转的 deepseek 教程

其实还有很多人没用过大模型,就算不说老人小孩,成年人要是对新事物不太感冒,可能都没有用过。考虑到这点,写个教程,尽可能简单,也足够有趣,让老妈都能玩转 deep...

什么模型好?

什么模型好?最近又密集做了一波应用,换了很多模型,感受:国内模型相比于顶尖国外模型还有差距,尤其是在真实生产环境(包括RAG、Agent、数据合成等应用中)

小型语言模型(参数在 0.5B-3B )可以做哪些事情?

大模型很有用基本上是共识,参数只有几b的小模型呢?因为性能不高直接当作对话工具显然不太行,但也有很多应用场景。这里整理了Hacker News上的一个讨论“有人...

大语言模型(LLM)学习路径和资料汇总

收集整理的一些大语言模型(LLM)学习路径和资料汇总

OpenAI发布最新模型规范

OpenAI在官网发布了最新的模型规范,希望可以进一步强化对可定制性、透明度以及探索、辩论和使用AI的智力自由的承诺。

一文图解 DeepSeek-R1 的出众推理能力从何而来?

今天这篇深度解析 DeepSeek-R1 训练方法的文章,将展示一个令人耳目一新的解决方案:如何通过创新的强化学习方法,在少量高质量人工标注数据的情况下,打造出...

推荐资讯

国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​ 《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...
DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统...
AI 的关键是语料 我的观点是,不管怎么调整模型的架构、功能、参数,作用是有限的,真正决定性的因素是训练模型的语料。不需...
本地运行DeepSeek R1的全面入门指南 本地运行DeepSeek R1的全面入门指南,介绍各种本地运行DeepSeek R1方法。