大模型

关键词
如何用DeepSeek-R1蒸馏出属于你自己的大模型

发现了一个新的fune-tune框架,可以在1小时内让DeepSeek-R1蒸馏出属于你自己的小模型,整个过程是全自动的,不需要编写代码或者手动调节,仅需定义你...

中国信通院发起大模型幻觉测试,总体涉及五种测试维度

据「中国信通院」公众号消息,中国信息通信研究院人工智能所基于前期的 AI Safety Benchmark 测评工作,发起大模型幻觉测试。本轮幻觉测试工作将以大...

什么模型好?

什么模型好?最近又密集做了一波应用,换了很多模型,感受:国内模型相比于顶尖国外模型还有差距,尤其是在真实生产环境(包括RAG、Agent、数据合成等应用中)

即梦 AI 图片模型 2.1 ,可以“一句话生成中文海报”的大模型

字节跳动旗下即梦 AI ,全新图片模型 2.1 。支持通过简单的指令,控制文字的颜色和位置等元素,快速生成中英文图像海报。号称“一句话生成中文海报”。

推荐资讯

PHP老矣,尚能饭否? 近日 GitHut 最新公布的数据显示,开发者在 GitHub 提交的 PR 中,所使用语言为 PH...
国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
什么是全栈开发人员:所需的基本技能 当您使用应用程序时,您通常认为谁负责?我相信您会考虑web开发人员。尽管您部分正确,但全栈开发人员是...
为什么 Laravel 这么优秀 Laravel 一直是我心中最优雅的后端框架,为了向更多的人解释为什么 Laravel 这么优雅?框...
微信小程序学习笔记,知识点全面概括总结 微信小程序学习笔记,知识点全面概括总结
MySQL安全最佳实践指南(2024版) 由于存储着敏感数据,MySQL数据库正沦为网络罪犯的攻击目标。这份全面的安全指南将深入研究保护MyS...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
《DeepSeek:从入门到精通》 104 页高清PDF,清华大学出品! ​ 《DeepSeek从入门到精通2025》是由清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的余...
DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,以及如... DeepSeek 团队分享了针对 DeepSeek-R1 部署的最佳设置,包含了推荐的温度设置、系统...
2024年技术发展趋势 展望2024年,许多科技领导者和观察人士表示,人工智能仍将主导对话和企业计划。然而,重点不仅在于其扩...