Skip to content

GPU distribuída

Frente estratégica da plataforma GPU pra pesquisa em humanidades digitais. Visa serving (vLLM, SGLang), batch (fine-tuning Unsloth, OCR Docling, dataset generation), e scheduling cross-site (MultiKueue) sobre cluster GPU SP + cluster GPU Franca futuro.

Sub-temas

Articulação com camadas e transversais

CamadaPapel
0 — VirtualizaçãoHardware GPU (A5000 SP, A5500 Franca) + tiers
5 — K8s runtimeK3s standalone GPU (SP) ou parte de cluster (Franca)
6 — K8s networkingflannel em SP (Tier 3 LXC), Cilium em Franca (Tier 2A VM)
7 — GitOpsArgoCD multi-cluster registra clusters GPU
8 — Multi-clusterMultiKueue cross-site pra batch jobs
9 — WorkloadsvLLM, SGLang, Kueue, HAMi, MLflow, DVC, Qdrant
TransversalPapel
IAMAutenticação de pesquisadores submitendo jobs
Observabilidadenvidia-smi, dcgm-exporter, Hubble
Cost attributionOpenCost por projeto (FAPESP)

Estado

  • gpu-sp-01 (LXC + K3s + A5000) em produção
  • ❌ HAMi / NVIDIA Device Plugin
  • ❌ vLLM / SGLang em produção
  • ❌ Kueue + MultiKueue
  • 🔮 Cluster GPU Franca em VM (Tier 2A)
  • 🔮 Conector Grid Unesp / HPC externo

Ver ADR-009 pra arquitetura assimétrica SP/Franca.