ADR-003 — LINSTOR como storage primário, Ceph deferido

Status

Vigente — 2026-05-01. Não é dogma — Ceph deve ser reavaliado com critérios objetivos.

CPPS precisa de storage replicado intra-site pra:

Opções consideradas:

Cluster atual: 6 hosts em SP, 7 em Franca com rede 10G dedicada.

LINSTOR + DRBD como storage primário. Pool por site (linstor-ssd-01 em SSD, linstor-nvme-01 em NVMe), controller HA via VRRP.

Ceph deferido, não rejeitado.

Ceph: requer mais nodes (recomendação: 5+ OSDs por pool com 3 replicas), CPU/RAM overhead significativo, curva de aprendizado e operação maior. Pra escala atual (6 hosts SP), LINSTOR é mais simples. Ceph seria reavaliado se aparecer demanda por: (a) object storage unificado com block, (b) escala >10 OSDs, (c) requisito de filesystem distribuído.
NFS/iSCSI: sem replicação automática; ponto único de falha sem solução HA externa
GlusterFS: depreciado pela RedHat em 2023, evitar

Positivas:

Negativas:

Sem object storage nativo (precisa MinIO em cima se quiser)
Sem filesystem distribuído (precisa NFS ou similar pra share file-level)
DRBD historicamente teve bugs sutis em split-brain — exige operação cuidadosa
Cross-site replication via DRBD é possível mas frágil em links com latência alta

Reabrir LINSTOR vs Ceph se:

Sinal de alerta: se 30%+ do tempo de SRE virar “operar LINSTOR” (vs usar), o mais simples passou a ser o mais complexo — Ceph entra em jogo.