LLM全栈框架完整分类清单(预训练+微调+工具链)

news/2025/2/26 17:19:38

一、预训练框架

1. 大规模分布式训练框架

框架名称核心能力GitHub地址
Megatron-LM3D并行训练、FlashAttention支持、Transformer架构优化(NVIDIA生态)NVIDIA/Megatron-LM
DeepSpeedZeRO优化系列、3D并行、RLHF全流程支持(微软生态)microsoft/DeepSpeed
ColossalAI多维并行、Gemini内存管理、自动并行策略(国产最优方案)hpcaitech/ColossalAI
BMTrain中文模型优化、ZeRO实现、显存优化(OpenBMB生态)OpenBMB/BMTrain
Alpa自动并行训练、JAX/TPU原生支持(学术研究友好)alpa-projects/alpa
FastMoEMoE架构专用、动态路由优化(混合专家模型首选)laekov/fastmoe

2. 通用训练框架

框架名称核心能力GitHub地址
Fairseq序列模型优化、多任务支持(Meta官方框架)facebookresearch/fairseq
PaddlePaddle全栈支持、产业级优化(百度飞桨生态)PaddlePaddle/Paddle
MindSpore端边云协同、自动并行(华为昇腾生态)mindspore-ai/mindspore
OneFlow分布式训练、静态图优化(国产高性能框架)Oneflow-Inc/oneflow
JAX/Flax函数式编程、TPU原生优化(Google科研生态)google/jax

3. 预训练工具链

工具名称核心能力GitHub地址
Transformers集成数万预训练模型、多模态支持(Hugging Face生态核心)huggingface/transformers
ModelScope模型仓库+训练平台(阿里巴巴多模态生态)modelscope/modelscope
FairScale分布式训练、显存优化(Meta官方工具)facebookresearch/fairscale

二、微调框架

1. 全参数微调框架

框架名称核心能力GitHub地址
LitGPTFSDP支持、量化训练、全流程管理(Lightning AI官方方案)Lightning-AI/lit-gpt
DeepSpeed-ChatRLHF全流程优化、混合并行(微软对话模型专用)microsoft/DeepSpeed-Chat
MosaicML算法优化、云端训练(商业级SaaS方案)mosaicml/composer

2. 参数高效微调(PEFT)

框架名称核心能力GitHub地址
PEFTLoRA/QLoRA/AdaLoRA、Prefix Tuning(Hugging Face官方库)huggingface/peft
OpenDeltaDelta Tuning、多模态适配器(清华NLP组)thunlp/OpenDelta
S-LoRA服务化LoRA、动态批处理(Stanford优化方案)S-LoRA/S-LoRA

3. 指令微调框架

框架名称核心能力GitHub地址
LLaMA-Factory多模型支持、RLHF集成(社区最活跃框架)hiyouga/LLaMA-Factory
Chinese-LLaMA-Alpaca中文指令优化、词表扩展(中文领域首选)ymcui/Chinese-LLaMA-Alpaca
TRLRLHF训练、PPO/DPO实现(Hugging Face官方方案)huggingface/trl

4. 量化训练框架

框架名称核心能力GitHub地址
GPTQ低比特量化、训练后优化(IST-DASLab方案)IST-DASLab/gptq
QLoRA量化LoRA、显存占用优化(华盛顿大学方案)artidoro/qlora
BitsAndBytes8bit优化、量化训练(Tim Dettmers主导)TimDettmers/bitsandbytes

三、支撑工具链

1. 推理优化框架

框架名称核心能力GitHub地址
vLLMPagedAttention、高吞吐推理(工业级首选)vllm-project/vllm
TensorRT-LLMNVIDIA硬件优化、低延迟推理(企业级部署)NVIDIA/TensorRT-LLM
llama.cppCPU推理、GGUF量化(边缘计算首选)ggerganov/llama.cpp

2. 评估与基准测试

框架名称核心能力GitHub地址
OpenCompass多维度评估、性能分析(上海AI Lab)InternLM/opencompass
LM-Evaluation-Harness标准测试集、跨模型对比(EleutherAI)EleutherAI/lm-evaluation-harness

3. 数据处理工具

工具名称核心能力GitHub地址
Datasets数据加载与预处理(Hugging Face生态)huggingface/datasets
WebDataset流式处理、超大规模数据支持webdataset/webdataset

4. 分布式训练支持

框架名称核心能力GitHub地址
Ray资源调度、分布式计算(UC Berkeley方案)ray-project/ray
Horovod多框架支持、易用性优化(Uber开源)horovod/horovod

四、选型指南

预训练场景

  • 超大规模训练:DeepSpeed(ZeRO优化) + Megatron-LM(模型并行)
  • 国产化需求:ColossalAI(多维并行) + PaddlePaddle(产业级支持)
  • 学术研究:JAX/Flax(函数式编程) + Fairseq(序列模型优化)

微调场景

  • 参数高效:PEFT(LoRA/QLoRA) + OpenDelta(多任务适配)
  • 中文优化:Chinese-LLaMA-Alpaca(指令微调) + ChatGLM-Tuning(清华方案)
  • 工业级部署:vLLM(高吞吐) + TensorRT-LLM(NVIDIA硬件加速)

工具链补充

  • 数据处理:Datasets(标准化) + WebDataset(流式处理)
  • 量化压缩:GPTQ(训练后量化) + QLoRA(微调量化)

本清单覆盖 GitHub Star > 1k 的主流框架,按技术栈和场景分类,持续跟踪最新技术演进。

免责声明

本报告(“LLM全栈框架完整分类清单(预训练+微调+工具链)”)由[ViniJack.SJX] 根据公开可获得的信息以及作者的专业知识和经验撰写,旨在提供关于“LLM全栈框架完整分类清单(预训练+微调+工具链)”的分析和信息。

1. 信息准确性与完整性:

  • 作者已尽最大努力确保报告中信息的准确性和完整性,但不对其绝对准确性、完整性或及时性做出任何明示或暗示的保证。

  • 报告中的信息可能随时间推移而发生变化,作者不承担更新报告内容的义务。

  • 报告中引用的第三方信息(包括但不限于网站链接、项目描述、数据统计等)均来自公开渠道,作者不对其真实性、准确性或合法性负责。

2. 报告用途与责任限制:

  • 本报告仅供参考和学习之用,不构成任何形式的投资建议、技术建议、法律建议或其他专业建议。

  • 读者应自行判断和评估报告中的信息,并根据自身情况做出决策。

  • 对于因使用或依赖本报告中的信息而导致的任何直接或间接损失、损害或不利后果,作者不承担任何责任。

3. 技术使用与合规性:

  • 本报告中提及的任何爬虫框架、工具或技术,读者应自行负责其合法合规使用。

  • 在使用任何爬虫技术时,读者应遵守相关法律法规(包括但不限于数据隐私保护法、知识产权法、网络安全法等),尊重网站的服务条款和robots协议,不得侵犯他人合法权益。

  • 对于因读者违反相关法律法规或不当使用爬虫技术而导致的任何法律责任或纠纷,作者不承担任何责任。

4. 知识产权:

  • 本报告的版权归作者所有,未经作者书面许可,任何人不得以任何形式复制、传播、修改或使用本报告的全部或部分内容。

  • 报告中引用的第三方内容,其知识产权归原作者所有。

5. 其他:

  • 本报告可能包含对未来趋势的预测,这些预测基于作者的判断和假设,不构成任何形式的保证。

  • 作者保留随时修改本免责声明的权利。

请在使用本报告前仔细阅读并理解本免责声明。如果您不同意本免责声明的任何条款,请勿使用本报告。


http://www.niftyadmin.cn/n/5868979.html

相关文章

C++ 多态小练习

编写一个如下场景: 有一个英雄Hero类,私有成员,攻击,防御,速度,生命值,以及所有的set get 方法 编写一个 武器 Weapon 类,拥有私有成员攻击力,以及set get 方法 编写一个…

【linux配置】 修改内核网络参数

命令解释 echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore 这个命令的具体含义是: echo 1:将值1写入文件。 /proc/sys/net/ipv4/conf/all/arp_ignore:将值1写入 /proc/sys/net/ipv4/conf/all/arp_ignore 文件,从而修改内核参…

【前端】【面试】【树】JavaScript 树形结构与列表结构的灵活转换:`listToTree` 与 `treeToList` 函数详解

JavaScript 树形结构与列表结构的灵活转换:listToTree 与 treeToList 函数详解 在前端开发的数据处理工作中,树形结构和列表结构是两种常见的数据形式。树形结构能够清晰展示数据间的层级关系,适合用于菜单、组织架构等场景;而列…

【HarmonyOS Next】鸿蒙应用公钥和证书MD5指纹的获取

【HarmonyOS Next】鸿蒙应用公钥和证书MD5指纹的获取 一、问题背景 政府的icp备案时,或者某些三方SDK以来的管理后台,都需要配置鸿蒙应用的公钥和证书MD5指纹 二、解决方案 专有名词解释: 华为AppGallery Connect简称 AGC平台&#xff0…

DeepSeek 开源周:DeepEP 项目详解,GPU 压榨计划启动!

引言 就在今天,2025年2月25日,DeepSeek 再次为人工智能社区带来了一场技术盛宴——DeepEP 项目的开源。这个旨在优化 GPU 性能的工具一经发布便迅速获得了广泛的关注和赞誉,短短两小时内就斩获了超过1000个 Star。本文将详细介绍 DeepEP 的功…

JNA基础使用,调用C++返回结构体

C端 test.h文件 #pragma oncestruct RespInfo {char* path;char* content;int statusCode; };extern "C" { DLL_EXPORT void readInfo(char* path, RespInfo* respInfo); }test.cpp文件 #include "test.h"void readInfo(char* path, RespInfo* respInfo…

android 新增native binder service 方式(三)

书接上回,继续第三种方式,是手动生成 service binder 的方法,项目结构 1,编译aidl aidl 文件保持不变,如何生成Bn和Bp 文件呢。 aidl -I ./libserviceaidl/aidl -h ./ -o ./ --langcpp libserviceaidl/aidl/com/test/IService.a…

【LeetCode 热题100】 240. 搜索二维矩阵 II的算法思路及python代码

240. 搜索二维矩阵 II 编写一个高效的算法来搜索 m n m \times n mn 矩阵 m a t r i x matrix matrix 中的一个目标值 t a r g e t target target。该矩阵具有以下特性: 每行的元素从左到右升序排列。每列的元素从上到下升序排列。 示例 1: 输入…