第2页_大模型_大模型_AI

大模型

栏目

文章 AI AIGC ChatGPT AI绘画机器学习深度学习大模型自然语言处理人工智能专题 Wiki 软件

关键词

搜索

排序

时间排序点击排序

多个大模型常用的搜索api插件分享

推荐谷歌搜索插件、exa search api和firecrawl搜索API工具。exa提供精炼html搜索结果，firecrawl价格亲民，结果适合大模型。搜...

大模型搜索 2025-03-22 09:56:42 36 浏览

能在24GB显存显卡上运行的最佳模型是什么？

能在24GB显存显卡上运行的最佳模型是什么？reddit上一位老哥kyazoglu，花了一个半月测试了在24GB显存显卡上运行的所有模型，得出来这张表。给希望本...

大模型显存 2025-03-06 10:32:57 28 浏览

OpenAI发布最新模型规范

OpenAI在官网发布了最新的模型规范，希望可以进一步强化对可定制性、透明度以及探索、辩论和使用AI的智力自由的承诺。

OpenAI AI 大模型 2025-02-19 10:18:06 27 浏览

LLaMA模型系统全面解读

简介：LLaMA模型系统由Meta AI推出，基于Transformer架构，具有高效参数利用和灵活规模选择等优势。本文深入解读LLaMA模型的核心原理、技术特...

大模型 Llama 2025-02-20 10:26:56 27 浏览

阿里发布全新开源推理模型 QwQ-32B，其性能可与 DeepSeek-R1 媲美

阿里云通义千问官方公众号发文宣布，推出最新的推理模型 QwQ-32B。一款拥有 320 亿参数的模型，其性能可与具备 6710 亿参数（其中 370 亿被激活）...

推理模型大模型阿里 QwQ 2025-03-07 09:30:30 24 浏览

阿里视频生成大模型万相2.1开源！效果超Sora，消费级显卡就能跑

阿里云视频生成大模型万相2.1（Wan）正式开源，此次开源采用Apache2.0协议，14B和1.3B两个参数规格的全部推理代码和权重全部开源，同时支持文生视频...

阿里大模型万相 2025-03-08 10:38:06 24 浏览

如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架，可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型，整个过程是全自动的，不需要编写代码或者手动调节，仅需定义你...

DeepSeek 蒸馏大模型 2025-03-06 10:46:49 20 浏览

Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型

Claude 3.7 Sonnet 是 Anthropic 迄今最聪明的模型，也是首个 Claude 模型，能进行“扩展思考”，也就是通过细致的、一步步的推理来...

Claude Anthropic 大模型 2025-03-06 11:00:24 20 浏览

网友分享的在不同任务场景选择的最佳模型

网友分享的在不同任务场景选择的最佳模型：

大模型 2025-03-18 13:35:01 18 浏览

超越DeepSeek R1与GPT 4.5,百度周末两连发！文心大模型4.5及X1，免费！

超越DeepSeek R1与GPT 4.5,百度周末两连发！文心大模型4.5及X1，免费！3月16日，文心大模型4.5和文心大模型X1正式发布！同时，文心大模型...

DeepSeek GPT 大模型文心大模型百度 2025-03-16 14:52:16 16 浏览

好的日常使用的模型推荐

好的日常使用的模型推荐（非广告～）

大模型 2025-03-17 15:56:30 15 浏览

中国信通院发起大模型幻觉测试，总体涉及五种测试维度

据「中国信通院」公众号消息，中国信息通信研究院人工智能所基于前期的 AI Safety Benchmark 测评工作，发起大模型幻觉测试。本轮幻觉测试工作将以大...

大模型幻觉 2025-03-20 10:32:23 15 浏览

即梦 AI 图片模型 2.1 ，可以“一句话生成中文海报”的大模型

字节跳动旗下即梦 AI ，全新图片模型 2.1 。支持通过简单的指令，控制文字的颜色和位置等元素，快速生成中英文图像海报。号称“一句话生成中文海报”。

AI 2025-03-13 10:20:33 13 浏览

什么模型好？

什么模型好？最近又密集做了一波应用，换了很多模型，感受：国内模型相比于顶尖国外模型还有差距，尤其是在真实生产环境（包括RAG、Agent、数据合成等应用中）

大模型 2025-02-18 14:53:16 11 浏览

推荐资讯

国内Ai大模型排行榜国内AI大模型的发展呈现出多样化的态势，各种类型的大模型纷纷涌现，包括改头换面的、剑走偏锋的、借壳炒...

《DeepSeek：从入门到精通》 104 页高清PDF，清华大学出品！《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...

一文读懂！DeepSeek R1超简易本地安装运行部署教程部署 DeepSeek R1 本地模型，并通过 Ollama 提供 API 支持。配合全栈AI助手 ...

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如何避免模型绕过思维的指南

DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置，包含了推荐的温度设置、系统...

AI 的关键是语料我的观点是，不管怎么调整模型的架构、功能、参数，作用是有限的，真正决定性的因素是训练模型的语料。不需...

本地运行DeepSeek R1的全面入门指南本地运行DeepSeek R1的全面入门指南，介绍各种本地运行DeepSeek R1方法。