关键词
一文看懂小模型与端侧模型

“小模型”通常指的是那些参数规模远少于GPT-3或Llama-13B的大语言模型,几个具有代表性的参数为1.5B、3B、7B等。“端侧模型”则通常指的是部署在手...

普通人如何利用AI赚钱?

普通人如何利用AI赚钱?AI技术的快速发展为普通人带来了许多新的赚钱机会。以下是一些适合普通人利用AI技术赚钱的方法,结合了最新的趋势和实际案例:

什么是模型蒸馏

模型被问的最多的一类问题是:“你是什么模型?你的开发者是谁?”,然而你有时候并不能得到准确的答案,很多模型会自称是 GPT-4 或者 Claude,但实际上它们...

老妈都能玩转的 deepseek 教程

其实还有很多人没用过大模型,就算不说老人小孩,成年人要是对新事物不太感冒,可能都没有用过。考虑到这点,写个教程,尽可能简单,也足够有趣,让老妈都能玩转 deep...

什么模型好?

什么模型好?最近又密集做了一波应用,换了很多模型,感受:国内模型相比于顶尖国外模型还有差距,尤其是在真实生产环境(包括RAG、Agent、数据合成等应用中)

个人推测2025年AI大概率发生的几个事情

个人推测2025年AI大概率发生的几个事情

ChatGPT API 相比 ChatGPT 的一些优点

ChatGPT API 相比 ChatGPT 的一些优点:显式定义角色,选择性地去掉会话中的信息,返回多个结果供选择,使用 logit_bias 参数调整特定词...

Jim Fan2024年终推文:这是AI的疯狂一年

读了一下: 1、具身智能突破越来越多,AI在2025年必然要从屏幕里跳出来;2、大模型三杰是Claude、OpenAI和Gemini,以及黑马Deepseek;...

DeepSeek创始人梁文锋是个什么样的人?

梁文峰的成长经历与投资之路1. 出生背景和早期经历梁文峰,1985年出生于广东省湛江市吴川市覃巴镇米历岭村,家境普通,父母都是小学语文老师,并无显赫背景。他主要...

面试指南之算法面试心得

算法面试心得,本文介绍如何准备算法面试,包括算法的基础知识、面试常见问题,以及面试经验总结等,凭借本文你可以轻松拿到“offer收割机”称号。

小型语言模型(参数在 0.5B-3B )可以做哪些事情?

大模型很有用基本上是共识,参数只有几b的小模型呢?因为性能不高直接当作对话工具显然不太行,但也有很多应用场景。这里整理了Hacker News上的一个讨论“有人...

大语言模型(LLM)学习路径和资料汇总

收集整理的一些大语言模型(LLM)学习路径和资料汇总

OpenAI发布最新模型规范

OpenAI在官网发布了最新的模型规范,希望可以进一步强化对可定制性、透明度以及探索、辩论和使用AI的智力自由的承诺。

一文图解 DeepSeek-R1 的出众推理能力从何而来?

今天这篇深度解析 DeepSeek-R1 训练方法的文章,将展示一个令人耳目一新的解决方案:如何通过创新的强化学习方法,在少量高质量人工标注数据的情况下,打造出...

国产AI大模型开源引爆海外 新闻时间线总结

#国产AI大模型开源引爆海外# 新闻时间线总结

推荐资讯

PHP老矣,尚能饭否? 近日 GitHut 最新公布的数据显示,开发者在 GitHub 提交的 PR 中,所使用语言为 PH...
国内Ai大模型排行榜 国内AI大模型的发展呈现出多样化的态势,各种类型的大模型纷纷涌现,包括改头换面的、剑走偏锋的、借壳炒...
什么是全栈开发人员:所需的基本技能 当您使用应用程序时,您通常认为谁负责?我相信您会考虑web开发人员。尽管您部分正确,但全栈开发人员是...
为什么 Laravel 这么优秀 Laravel 一直是我心中最优雅的后端框架,为了向更多的人解释为什么 Laravel 这么优雅?框...
微信小程序学习笔记,知识点全面概括总结 微信小程序学习笔记,知识点全面概括总结
MySQL安全最佳实践指南(2024版) 由于存储着敏感数据,MySQL数据库正沦为网络罪犯的攻击目标。这份全面的安全指南将深入研究保护MyS...
如何在 PHP 中检测 n+1 查询 n+1查询问题是软件开发中常见的性能问题。 N+1 查询会导致许多不必要的数据库调用。这可能会导致您...
2024年技术发展趋势 展望2024年,许多科技领导者和观察人士表示,人工智能仍将主导对话和企业计划。然而,重点不仅在于其扩...
一文读懂!DeepSeek R1超简易本地安装运行部署教程 部署 DeepSeek R1 本地模型,并通过 Ollama 提供 API 支持。配合全栈AI助手 ...
如何保持 SSH 会话处于活动状态 体验无忧的 SSH 会话。按照我们的指南保持您的连接畅通并消除冻结问题