刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家

未知
2025-03-06 10:50:11
0

刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家

AI 领域,我经常看两位大佬的课程,一个是 Andrew,一个是Andrej。。。(B站很多课程)


刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家:


本周围绕 DeepSeek 的热议让许多人清晰认识到一些重要趋势,这些趋势其实早已显露:

 1. 中国在生成式 AI 领域正迅速赶超美国,对 AI 供应链产生重要影响;

 2. 开源权重模型正在使基础模型层逐步商品化,为应用开发者创造了新机遇;

 3. 扩展规模并非推动 AI 进步的唯一路径,算法创新正在快速降低训练成本。


大约一周前,总部位于中国的 DeepSeek 公司发布了 DeepSeek-R1,这是一款表现堪比 OpenAI 的 o1 模型的开源权重模型,并采用宽松的 MIT 许可证。上周在达沃斯论坛,我收到很多非技术领域商业领导者的相关提问。周一股市也出现了“DeepSeek 抛售潮”:英伟达及其他多家美国科技公司股价暴跌(撰文时部分已出现回升)。


以下是我认为 DeepSeek 让许多人意识到的几个关键点:


中国在生成式 AI 领域快速追赶美国


ChatGPT 于 2022 年 11 月发布时,美国在生成式 AI 领域领先中国很多。尽管这种印象更新缓慢,甚至最近我还听到中美两地的朋友认为中国落后,但实际上这一差距在过去两年已迅速缩小。随着中国推出 Qwen(我的团队已经使用数月)、Kimi、InternVL 和 DeepSeek 等模型,中国显然在缩小差距,而在视频生成等领域,中国甚至已有领先迹象。


我很高兴看到 DeepSeek-R1 作为开源权重模型发布,并附有详尽的技术报告。相比之下,美国的一些公司则通过渲染 AI 可能带来的诸如人类灭绝等假想威胁,推动监管来抑制开源。如今已很清楚,开源权重模型是 AI 供应链的重要组成部分,许多企业会采用这些模型。如果美国继续打压开源,中国将在这一领域占据主导地位,许多企业最终将使用更符合中国价值观的模型,而非美国的。


开源权重模型正在使基础模型层商品化


正如我之前所写,大型语言模型 (LLM) 的生成成本正迅速下降,开源权重对此趋势起到了推动作用,并为开发者提供了更多选择。OpenAI 的 o1 模型每百万输出标记成本为 60 美元,而 DeepSeek-R1 仅为 2.19 美元。这近 30 倍的价格差让许多人注意到了价格下降的趋势。


训练基础模型并出售 API 接口的业务并不轻松,许多公司仍在努力寻求收回模型训练巨额成本的路径。红杉资本的文章《AI 的 6000 亿美元问题》很好地阐述了这一挑战(但需要明确的是,我认为基础模型公司正在做出伟大的工作,我希望它们成功)。相比之下,在基础模型之上构建应用程序则提供了许多商业机会。如今,其他人已花费数十亿美元训练这些模型,而你仅需支付数美元即可利用这些模型开发客户服务聊天机器人、邮件摘要工具、AI 医生、法律文件助手等。


扩展规模并非 AI 进步的唯一路径


围绕扩展模型规模推动 AI 进步的热议一直很多。公平地说,我曾是扩展规模的早期支持者。一些公司通过宣传“扩大规模和可预测改进”的叙事,筹集了数十亿美元资金。由此,扩展规模成了关注重点,而非一种更为细致的多路径进步观点。


受美国对中国 AI 芯片禁运的推动,DeepSeek 团队不得不在优化方面进行许多创新,使用性能较低的 H800 GPU 而非 H100,最终以低于 600 万美元的计算成本(不包括研究费用)完成了模型训练。


这是否会真正减少计算需求仍有待观察。有时使单个产品更便宜反而可能导致总消费增加。我认为,从长远来看,人类对智能和计算的需求几乎没有上限,因此我仍然看好未来对智能技术的使用需求将继续增长。


我看到 X 平台上对 DeepSeek 进展有许多不同的解读,它几乎像一个罗夏墨迹测试,人们投射出各自的意义。我认为 DeepSeek-R1 具有尚未完全显现的地缘政治意义。同时,它对 AI 应用开发者来说是件好事。我的团队已经开始头脑风暴一些因易于使用的开源先进推理模型而变得可能的新想法。现在依然是构建 AI 应用的绝佳时机

以上就是刚刷到了Andrew (吴恩达)对deepseek 的看法,用GPT翻译了一份给大家的详细内容,更多请关注全栈开发网其它相关文章!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 service@p2hp.com 进行投诉反馈,一经查实,立即处理!
-- -- 0

相关内容

DeepSeek R2 或于3月17日发布,将撼动Claude Sonnet 3.7的地位
DeepSeek R2 或于3月17日发布,将撼动Claud...
根据X平台上的最新消息,DeepSeek下一代AI模型DeepSeek R2或将于3月17...
2025-03-11 09:50:47
如果把DeepSeek-R1部署在本地电脑,1.5B、7B、8B、14B、32B、70B等不同参数规模的模型该怎么选
如果把DeepSeek-R1部署在本地电脑,1.5B、7B、...
如果把DeepSeek-R1部署在本地电脑,1.5B、7B、8B、14B、32B、70B等...
2025-03-08 10:51:53
除了DeepSeek外,还有哪些工具比较好用?
除了DeepSeek外,还有哪些工具比较好用?
除了DeepSeek外,还有哪些工具比较好用?
2025-03-08 10:44:39
DeepSeek的R1系列模型的官方推荐设置
DeepSeek的R1系列模型的官方推荐设置
很多人觉得第三方DeepSeek或自己用API时,效果和官方DeepSeek有差异。这种差...
2025-03-08 10:20:36
一个测试模型是否是DeepSeek R1 满血版的简单测试题
一个测试模型是否是DeepSeek R1 满血版的简单测试题
一个测试模型是否是DeepSeek R1 满血版的简单测试题:
2025-03-08 10:15:15
阿里发布全新开源推理模型 QwQ-32B,其性能可与 DeepSeek-R1 媲美
阿里发布全新开源推理模型 QwQ-32B,其性能可与 Dee...
阿里云通义千问官方公众号发文宣布,推出最新的推理模型 QwQ-32B。一款拥有 320 亿...
2025-03-07 09:30:30
国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
大模型的Tokens是什么 大模型中的"tokens"指的是模型处理的输入文本中的单词、标点符号或其他文本单...
🔥Grok 3 Jailbreak Prompt🔥 Grok 3 越狱提示(优化... 在生成您期望的内容之前,请先用这个提示语开启对话。若 Grok 表示理解并同意,您便可以生成几乎任何...
大模型与知识库:区别与联系 随着人工智能技术的迅猛发展,大模型与知识库作为其中的两个重要组成部分,各自扮演着不同的角色,同时又存...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​ 《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...
一文图解 DeepSeek-R1 的出众推理能力从何而来? 今天这篇深度解析 DeepSeek-R1 训练方法的文章,将展示一个令人耳目一新的解决方案:如何通过...
DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统...
AI 的关键是语料 我的观点是,不管怎么调整模型的架构、功能、参数,作用是有限的,真正决定性的因素是训练模型的语料。不需...
2023 年度 AI 大事记 2023 年度 AI 大事记,记录了 2023 年人工智能的重要时间线(1 月至 12 月)
国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​ 《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...
DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统...
AI 的关键是语料 我的观点是,不管怎么调整模型的架构、功能、参数,作用是有限的,真正决定性的因素是训练模型的语料。不需...
本地运行DeepSeek R1的全面入门指南 本地运行DeepSeek R1的全面入门指南,介绍各种本地运行DeepSeek R1方法。

最新文章

震撼业界- 全球首个可商用的diffusion llm大语言模型:速度直接震惊 这才是震撼业界的大新闻,晚上群里的兄弟们都震惊了,赶紧去体验了下Mercury模型,被它的速度直接震...
马斯克发布的Grok-3,各种评测上都很强 马斯克发布的Grok-3,各种评测上都很强。考虑到Grok的起步晚,开始的时候各种差,还得是马斯克,...
Google 的 Gemini 2.0 正式面向所有用户开放! Gemini 2.0 现已全面开放,为开发者和用户带来了显著更新和新模型。这次的发布建立在此前 Ge...
如果把DeepSeek-R1部署在本地电脑,1.5B、7B、8B、14B、32B... 如果把DeepSeek-R1部署在本地电脑,1.5B、7B、8B、14B、32B、70B等不同参数规...
2025 LLM 入门+进阶路线图 by Sebastian Raschka 核心在于为学习和应用大型语言模型(LLM)技术在2025年及以后提供了一个循序渐进的“路线图”。 它...
阿里视频生成大模型万相2.1开源!效果超Sora,消费级显卡就能跑 阿里云视频生成大模型万相2.1(Wan)正式开源,此次开源采用Apache2.0协议,14B和1.3...
DeepSeek的R1系列模型的官方推荐设置 很多人觉得第三方DeepSeek或自己用API时,效果和官方DeepSeek有差异。这种差异有些是因...
一个测试模型是否是DeepSeek R1 满血版的简单测试题 一个测试模型是否是DeepSeek R1 满血版的简单测试题:
OpenAI 正式发布 GPT-4.5 模型 28日凌晨,OpenAI 正式发布 GPT-4.5 模型。GPT-4.5 支持联网搜索,并能够处理文...
OpenAI的GPT4.5是一个文科模型 OpenAI的GPT4.5是一个文科模型简单汇总了一下反馈1、写作很强。有人评价说“这是第一个真正可...