关键词
Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型

Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型,也是首个 Claude 模型,能进行“扩展思考”,也就是通过细致的、一步步的推理来...

谷歌推出Gemma 3:单GPU上运行的最强AI模型

谷歌近日推出了最新版本的 Gemma AI 模型 ——Gemma3,声称这是 “全球最强的单加速器模型”。与之前发布的 Gemma AI 系列相比,Gemma3...

通俗解读 DeepSeek-R1 训练过程

通俗解读 DeepSeek-R1 训练过程】 DeepSeek-R1 通过创新性地结合强化学习和监督学习,以低成本实现了与现有顶尖模型相当的推理能力,挑战了传...

好的日常使用的模型推荐

好的日常使用的模型推荐(非广告~)

Deepseek-v3技术报告简报

Deepseek-v3技术报告简报。大家知道,硅谷的某几个前沿闭源模型公司,对外分享的技术信息越来越少了,报告里谈细节也是语焉不详。但是这次Deepseek-v...

用Gemini翻译文章的优缺点及注意事项

用Gemini翻译文章的优缺点及注意事项,Gemini优点是上下文超长,翻译完成度极高,优化Prompt后甚至能避免某些“AI味检测”。而缺点或要注意的地方可能...

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架,可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型,整个过程是全自动的,不需要编写代码或者手动调节,仅需定义你...

GPT-4.5 登场:OpenAI 最强、最佳 AI 聊天模型,更睿智、更高“情商”、更少幻觉

【GPT-4.5 登场:OpenAI 最强、最佳 AI 聊天模型,更睿智、更高“情商”、更少幻觉】#GPT4.5将首先向ChatGPTPro用户开放# 2 月 ...

一个讲解如何从头开始构建 DeepSeek R1的项目

开发者Fareed Khan's 用手绘流程图以及代码的方式,逐步讲解如何按照 deepseek 技术报告构建一个可以在本地运行的小型基础模型。非常详...

混元-T1: 强化学习驱动,业内首个超大规模混合Mamba推理模型正式发布

强化学习在大语言模型的后训练阶段开创了新的Scaling范式,这一突破正日益受到业界重视。随着OpenAI O系列模型与DeepSeek R1的相继发布,模型展...

Kimi 最新模型 k1.6 登顶,编程能力超越 GPT o3mini、o1

2 月 27 日消息,Kimi 最新模型 k1.6 今日曝光。据全球动态基准测试平台 LiveCodeBench,Kimi k1.6 超过 GPT o3mini...

DeepSeek R1 系统提示词

DeepSeek R1 系统提示词:您是由中国公司深度求索(DeepSeek)独家开发的智能助手DeepSeek-R1。您将为用户提供有益、无害且详尽的回答。关...

中国信通院发起大模型幻觉测试,总体涉及五种测试维度

据「中国信通院」公众号消息,中国信息通信研究院人工智能所基于前期的 AI Safety Benchmark 测评工作,发起大模型幻觉测试。本轮幻觉测试工作将以大...

什么模型好?

什么模型好?最近又密集做了一波应用,换了很多模型,感受:国内模型相比于顶尖国外模型还有差距,尤其是在真实生产环境(包括RAG、Agent、数据合成等应用中)

OpenAI 正式发布 GPT-4.5 模型

28日凌晨,OpenAI 正式发布 GPT-4.5 模型。GPT-4.5 支持联网搜索,并能够处理文件和图片上传,还可以使用 Canvas 来进行写作和编程。

推荐资讯

国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​ 《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...
DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统...
AI 的关键是语料 我的观点是,不管怎么调整模型的架构、功能、参数,作用是有限的,真正决定性的因素是训练模型的语料。不需...
本地运行DeepSeek R1的全面入门指南 本地运行DeepSeek R1的全面入门指南,介绍各种本地运行DeepSeek R1方法。