Transformers Transformers 为 Jax、PyTorch 和 TensorFlow 打造的先进的自然语言处理

未知
2025-02-24 11:17:54
0
授权协议 Apache-2.0  
开发语言 Python
操作系统 跨平台  
软件类型 开源软件
开源组织
地区 不详
投 递 者 不详
适用人群 未知
收录时间 2025-02-24

Transformers 提供了数以千计的预训练模型,支持 100 多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。它的宗旨是让最先进的 NLP 技术人人易用。

🤗 Transformers 提供了便于快速下载和使用的API,让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。同时,每个定义的 Python 模块都是完全独立的,便于修改和快速进行研究实验。

🤗 Transformers 支持三个最热门的深度学习库: JaxPyTorch 以及 TensorFlow — 并与之无缝整合。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。


是 Hugging Face 团队开发的一个开源项目,专注于提供最先进的机器学习工具,主要用于自然语言处理(NLP)、计算机视觉、语音处理等多模态任务。它是一个功能强大且广受欢迎的 Python 库,支持 PyTorch、TensorFlow 和 JAX 等主流深度学习框架。


这个库的核心是 Transformers 架构(最初由 2017 年论文《Attention is All You Need》提出),它为用户提供了大量预训练模型,比如 BERT、GPT、T5 等,可以直接用于文本分类、翻译、问答、文本生成等任务。不仅如此,它还支持对这些模型进行微调(fine-tuning),让用户能够根据自己的数据集定制模型。


主要特点


  1. 预训练模型:库中集成了数百个预训练模型,直接从 Hugging Face Hub 下载,覆盖多种语言和任务。

  2. 简单易用的 API:通过 pipeline 接口,用户只需几行代码就能实现复杂任务,比如情感分析、目标检测或语音识别。例如:

    from transformers import pipeline classifier = pipeline("sentiment-analysis") result = classifier("I love this!") print(result) # 输出 [{'label': 'POSITIVE', 'score': 0.999}]


  3. 多模态支持:除了 NLP,它还能处理图像、音频甚至跨模态任务,如视觉问答或文档信息提取。

  4. 社区驱动:用户可以将自己的模型上传到 Hugging Face Hub,与全球开发者共享。

  5. 灵活性:支持从头训练新模型,也允许修改现有架构以适应研究需求。

如何安装


你可以通过以下命令安装:


pip install transformers

如果需要最新版本,可以从源码安装:


git clone https://github.com/huggingface/transformers.git cd transformers pip install .

应用场景


  • 研究:学术界用来快速实验新想法。

  • 工业:企业用它部署高效的 AI 解决方案。

  • 教育:学习者可以通过丰富的文档和示例代码入门 AI。

这个项目不仅是工具库,更是一个围绕 Hugging Face 生态系统的社区产物,与 Datasets、Tokenizers 等库无缝协作。它致力于让 AI 更易用、更开放,是目前机器学习领域的标杆之一。

代码

0

相关软件

GitHub Copilot - 由 GitHub、OpenAI 和 Microsoft 合作...
GitHub Copilot 是一个由 GitHub、OpenAI 和 Microsoft...
2025-02-24 12:04:19
ComfyUI - 最强大和模块化的扩散模型 GUI 和后端
ComfyUI 是一个基于 Web 的用户界面工具,主要用于生成人工智能(AI)驱动的图像...
2025-02-24 10:36:51
Llama - 由 Meta AI 开发的一个高效且性能卓越的开源语言模型系...
LLaMA 是由 Meta AI 开发的一个高效且性能卓越的语言模型系列,主要用于研究目的...
2025-02-24 10:17:39
Trae - 是一款自适应 AI IDE
Trae(/treɪ/)与 AI 深度集成,提供智能问答、代码自动补全以及基于 Agent...
2025-02-23 10:57:02
Windsurf - 新一代 AI 驱动的集成开发环境(IDE)
Windsurf 是由 Codeium 公司推出的一款新一代 AI 驱动的集成开发环境(I...
2025-02-23 10:43:38
Cursor - AI 代码编辑器
Cursor 是一款基于人工智能的代码编辑器,由美国公司 Anysphere 开发,旨在通...
2025-02-22 10:06:28
vLLM - 开源的、高效的大型语言模型(LLM)推理和服务的框架
vLLM 是一个开源的、高效的大型语言模型(LLM)推理和服务的框架,由加州大学伯克利分校...
2025-02-21 15:23:35
Cherry Studio - 一款支持多个大语言模型(LLM)服务商的桌面客户端
CherryStudio 是一款集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的全...
2025-02-21 13:59:58
Open WebUI - 用户友好的 AI 界面
Open WebUI 是一个功能丰富、用户友好的开源自托管人工智能界面,旨在为用户提供与大...
2025-02-21 13:36:11
AnythingLLM - 易于使用的一体化 AI 应用程序
AnythingLLM 是一个功能强大且灵活的开源 AI 应用程序,由 Mintplex ...
2025-02-21 13:15:16
ChatGPT - OpenAI发布的AI聊天机器人模型
ChatGPT(全名:Chat Generative Pre-trained Transf...
2024-03-10 11:59:39
ollama - 本地运行的大语言模型(LLM)平台 Ollama 是一个本地运行的大语言模型(LLM)平台,可以启动并运行 Llama 3.3、Deep...
Zed - 高性能、多人代码编辑器 Zed 是一款高性能、多人代码编辑器,由 Atom 和 Tree-sitter 的创建者开发。它也是...
HarmonyOS NEXT - 华为公司自研操作系统 HarmonyOS NEXT是华为公司自研操作系统,该系统是鸿蒙抛弃Linux内核及安卓开放源代码项...
ChatGPT - OpenAI发布的AI聊天机器人模型 ChatGPT(全名:Chat Generative Pre-trained Transformer...
PHP - 动态网页脚本语言 PHP(“PHP: Hypertext Preprocessor”,超文本预处理器的字母缩写)是一种...
Linux - 开源操作系统 Linux 是一个类 Unix 操作系统,是 Unix 的一种,它控制整个系统基本服务的核心程序 (...
Swoole - PHP 协程框架 Swoole 使 PHP 开发人员可以编写高性能高并发的 TCP、UDP、Unix Socket、H...
Electron - 跨平台桌面应用开发工具 Electron 是一个使用 JavaScript、HTML 和 CSS 构建跨平台的桌面应用程序。...
Cursor - AI 代码编辑器 Cursor 是一款基于人工智能的代码编辑器,由美国公司 Anysphere 开发,旨在通过集成先进...
FFmpeg - 多媒体处理工具 Fmpeg 是领先的多媒体框架,能够解码、编码、转码、混合、解密、流媒体、过滤和播放人类和机器创造的...

最新文章

🔥Grok 3 Jailbreak Prompt🔥 Grok 3 越狱提示(优化... 在生成您期望的内容之前,请先用这个提示语开启对话。若 Grok 表示理解并同意,您便可以生成几乎任何...
马斯克的xAI推出 Grok 3,免费体验直至服务器崩溃! 北京时间2月20日,马斯克创立的人工智能公司 xAI 宣布其最新的 Grok3模型正式开放免费使用,...
除了 temperature 之外,还有哪些参数对大模型的输出有比较大的影响 除了 temperature 之外,还有哪些参数对大模型的输出有比较大的影响除了 temperatu...
ai大模型的接口的system role重要吗 在 AI 大模型接口中,system role 是非常重要的,它起到设置整个对话基调和上下文的作用。...
如何使用 WinGet 在Windows上安装 PHP 8.4 本文介绍了如何使用 winget 搜索、下载、安装、更新和删除 Windows PHP 二进制文件。...
2025年国内外AI大模型的API接口网址整理 本文将盘点国内外的知名度较高的AI大模型平台,其中包括AI大语言模型和AI多模态模型,方便大家一探究...
大模型与知识库:区别与联系 随着人工智能技术的迅猛发展,大模型与知识库作为其中的两个重要组成部分,各自扮演着不同的角色,同时又存...
高性能PHP框架 webman 开发规范1.0 总结下webman最新版本的开发规范以及代码建议。欢迎大家提交自己更好的开发规范以及代码建议。
日常 AI 辅助编程的模型和工具搭配推荐 最近用 AI 辅助 编程比较多,对于复杂的算法和程序设计我是这么搭配使用的
AI基础概念 本章介绍了企业AI应用可能涉及到的一些相关概念,帮助大家更好的理解 AI的相关操作。