关键词
DeepSeek的R1系列模型的官方推荐设置

很多人觉得第三方DeepSeek或自己用API时,效果和官方DeepSeek有差异。这种差异有些是因为初始设置不同造成的。DeepSeek的官推刚给出了R1系列...

阿里视频生成大模型万相2.1开源!效果超Sora,消费级显卡就能跑

阿里云视频生成大模型万相2.1(Wan)正式开源,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频...

2025 LLM 入门+进阶路线图 by Sebastian Raschka

核心在于为学习和应用大型语言模型(LLM)技术在2025年及以后提供了一个循序渐进的“路线图”。 它以三个简洁明了的步骤,概括了从理论基础到实际应用的进阶路径,...

除了DeepSeek外,还有哪些工具比较好用?

除了DeepSeek外,还有哪些工具比较好用?

人工智能可能正在培养文盲程序员?

人工智能正在培养文盲程序员?这是最近一阵在国外技术社区很受关注的一个热门博客。作者Namanyay自14 岁就开始从事专业开发。但是他最近很困惑,因为觉得开发技...

如果把DeepSeek-R1部署在本地电脑,1.5B、7B、8B、14B、32B、70B等不同参数规模的模型该怎么选

如果把DeepSeek-R1部署在本地电脑,1.5B、7B、8B、14B、32B、70B等不同参数规模的模型该怎么选?关键看电脑的配置,以下供参考:

Google 的 Gemini 2.0 正式面向所有用户开放!

Gemini 2.0 现已全面开放,为开发者和用户带来了显著更新和新模型。这次的发布建立在此前 Gemini 2.0 实验版的基础之上,使强大 AI 变得更加易...

马斯克发布的Grok-3,各种评测上都很强

马斯克发布的Grok-3,各种评测上都很强。考虑到Grok的起步晚,开始的时候各种差,还得是马斯克,v3版本就赶上来了!

震撼业界- 全球首个可商用的diffusion llm大语言模型:速度直接震惊

这才是震撼业界的大新闻,晚上群里的兄弟们都震惊了,赶紧去体验了下Mercury模型,被它的速度直接震惊到懵逼了,竟然能这么快这才是震撼业界的大新闻,晚上群里的兄...

21种可以在手机上免费使用AI的方式

我发现还有很多人没有在手机上使用AI,这很令人震惊。AI可以使生活更轻松,提高整体生产力。这里有21种可以在手机上使用AI的方式(全部是免费的):👇

agent互联网时代来了,mcp协议相当于互联网时代的http协议

近期见到人就安利:agent互联网时代来了,mcp协议相当于互联网时代的http协议,打通了大模型、agent、rag、tools等各种端之间的数据通信,那就实...

DeepSeek R2 或于3月17日发布,将撼动Claude Sonnet 3.7的地位

根据X平台上的最新消息,DeepSeek下一代AI模型DeepSeek R2或将于3月17日正式发布。这一消息迅速引发业界关注,许多人认为这一新模型可能会对现有...

大模型的max_tokens参数是输出token数吗

在大多数大语言模型的API(如OpenAI的GPT系列、Anthropic的Claude、或国内的一些大模型)中,`max_tokens` 参数通常指的是模型生...

通俗解读MCP和Agent原理,包你看完秒懂!

什么是MCP?模型上下文协议(Model Context Protocol,简称 MCP):是一个由Anthropic推出的开放协议,它标准化了应用程序如何向大...

8 条 AI 编程指南

8 条 AI 编程指南

推荐资讯