第3页_大模型_AI_全栈开发网

栏目

文章 AI AIGC ChatGPT AI绘画机器学习深度学习大模型自然语言处理人工智能专题 Wiki 软件

关键词

搜索

排序

时间排序点击排序

DeepSeek的R1系列模型的官方推荐设置

很多人觉得第三方DeepSeek或自己用API时，效果和官方DeepSeek有差异。这种差异有些是因为初始设置不同造成的。DeepSeek的官推刚给出了R1系列...

DeepSeek DeepSeek-R1 2025-03-08 10:20:36 20 浏览

一文读懂：DeepSeek新模型大揭秘，为何它能震动全球AI圈

【编者按】课代表系列-AI大事儿的最快、最全解读，本文关注DeepSeek-R1在技术上最重要的突破——用纯深度学习的方法让AI自发涌现出推理能力。这一研究可能...

DeepSeek AI DeepSeek-R1 2025-03-19 09:51:48 20 浏览

阿里视频生成大模型万相2.1开源！效果超Sora，消费级显卡就能跑

阿里云视频生成大模型万相2.1（Wan）正式开源，此次开源采用Apache2.0协议，14B和1.3B两个参数规格的全部推理代码和权重全部开源，同时支持文生视频...

阿里大模型万相 2025-03-08 10:38:06 19 浏览

OpenAI GPT-4o 上线图像生成功能

OpenAI 宣布为 ChatGPT 推出图像生成功能：“将迄今最先进的图像生成器集成至 GPT-4o”，这是最近几年 ChatGPT 在图片处理能力方向的一次...

OpenAI AI GPT-4o 推荐 2025-03-27 13:07:01 19 浏览

2025 LLM 入门+进阶路线图 by Sebastian Raschka

核心在于为学习和应用大型语言模型（LLM）技术在2025年及以后提供了一个循序渐进的“路线图”。它以三个简洁明了的步骤，概括了从理论基础到实际应用的进阶路径，...

LLM 2025-03-08 10:39:14 18 浏览

LLaMA模型系统全面解读

简介：LLaMA模型系统由Meta AI推出，基于Transformer架构，具有高效参数利用和灵活规模选择等优势。本文深入解读LLaMA模型的核心原理、技术特...

大模型 Llama 2025-02-20 10:26:56 17 浏览

多个大模型常用的搜索api插件分享

推荐谷歌搜索插件、exa search api和firecrawl搜索API工具。exa提供精炼html搜索结果，firecrawl价格亲民，结果适合大模型。搜...

大模型搜索 2025-03-22 09:56:42 17 浏览

马斯克发布的Grok-3，各种评测上都很强

马斯克发布的Grok-3，各种评测上都很强。考虑到Grok的起步晚，开始的时候各种差，还得是马斯克，v3版本就赶上来了！

Grok 2025-03-08 10:55:04 16 浏览

Google Gemini 2.0 Flash 新增「原生图像生成」功能

Google 发文宣布，Google Gemini 2.0 Flash 引入了「原生图像生成」功能。

Google Gemini 推荐 2025-03-17 15:24:18 16 浏览

一文看懂小模型与端侧模型

“小模型”通常指的是那些参数规模远少于GPT-3或Llama-13B的大语言模型，几个具有代表性的参数为1.5B、3B、7B等。“端侧模型”则通常指的是部署在手...

小模型端侧模型推荐 2025-02-17 16:34:25 15 浏览

一个测试模型是否是DeepSeek R1 满血版的简单测试题

一个测试模型是否是DeepSeek R1 满血版的简单测试题：

DeepSeek DeepSeek-R1 2025-03-08 10:15:15 15 浏览

震撼业界- 全球首个可商用的diffusion llm大语言模型:速度直接震惊

这才是震撼业界的大新闻，晚上群里的兄弟们都震惊了，赶紧去体验了下Mercury模型，被它的速度直接震惊到懵逼了，竟然能这么快这才是震撼业界的大新闻，晚上群里的兄...

大语言模型 diffusionllm Mercury 推荐 2025-03-08 14:53:00 15 浏览

网友分享的在不同任务场景选择的最佳模型

网友分享的在不同任务场景选择的最佳模型：

大模型 2025-03-18 13:35:01 15 浏览

超越DeepSeek R1与GPT 4.5,百度周末两连发！文心大模型4.5及X1，免费！

超越DeepSeek R1与GPT 4.5,百度周末两连发！文心大模型4.5及X1，免费！3月16日，文心大模型4.5和文心大模型X1正式发布！同时，文心大模型...

DeepSeek GPT 大模型文心大模型百度 2025-03-16 14:52:16 14 浏览

能在24GB显存显卡上运行的最佳模型是什么？

能在24GB显存显卡上运行的最佳模型是什么？reddit上一位老哥kyazoglu，花了一个半月测试了在24GB显存显卡上运行的所有模型，得出来这张表。给希望本...

大模型显存 2025-03-06 10:32:57 13 浏览

推荐资讯