Skip to content

Latest commit

 

History

History
42 lines (30 loc) · 1.97 KB

README.md

File metadata and controls

42 lines (30 loc) · 1.97 KB

3K

codecov

简介

三千平台是云原生大模型训推平台,得名于其 3 个核心指标:

  • 千卡:支持千卡 A100 或等效智算集群
  • 千亿参数:支持千亿参数大模型训练、推理
  • 千小时:支持千小时以上无人干预大模型训练

Named after 3 major performance metrics of the system:

  • 1000+ GPUs
  • 100B+ Transformer model
  • 1000+ hours uninterrupted training

名词解释

Acronym Meaning 涵义
1g 1 GPU 1 卡
1h1g 1 node 1 GPU 1 机 1 卡
1h8g 1 node 8 GPU 1机8卡
2h8g 2 nodes 16 GPUs 2机16卡

SuperLinter

tools/super_linter.sh <file-or-directory-to-be-linted>

使用手册

  • 算想云:面向个人大模型开发者、中小大模型应用企业的无服务器(Serverless)大模型开发、训练、微调、推理云服务
  • 算力源:面向 GPU 集群产权方,通过算想云出租自有 GPU 集群的企业
  • 算想三千:面向企业大模型团队,私有化部署的大模型开发软件平台

安装 SLO

  • 1 小时以内完成安装,即从开始安装 1 小时以内三千平台(不包含大模型相关数据资产)完成安装;评判标准:可以开始运行 IB 测试任务、bert 任务
  • 3 小时内完成 LLaMA2-7B 数据资产安装;即从开始安装 3 小时以内 LLaMA2-7B 模型、容器镜像、数据集完成安装;评判标准:可以开始运行 LLaMA2-7B 预训练、微调、推理演示
  • 24 小时内完成 10 个主流的开源大模型的数据资产;即从开始安装 24 小时、评判标准:可以开始运行任意模型的微调、推理演示