Skip to content

Plataforma de Dados

Frente estratégica de implementação da plataforma de dados pra pesquisa em humanidades digitais. Visa data lake + ferramentas de análise qualitativa (CAQDAS) + GraphRAG sobre corpus textuais.

Sub-temas

Articulação com camadas e transversais

CamadaComponente da plataforma
1 — StorageLINSTOR pra dados estruturados; SeaweedFS pra object S3
9 — WorkloadsMinIO, Iceberg, Trino, Spark, Airflow, Qdrant, GraphRAG, CAQDAS apps
TransversalPapel
IAMRBAC por projeto/grupo de pesquisa
SecretsCredenciais de DBs, S3, APIs externas
Backup e continuidadeDatasets críticos (acervos, teses)
GovernançaLGPD, audit FAPESP, retenção

Estado

  • 🚧 Plano arquitetural ~80% completo (continuar 2026)
  • ❌ Implementação inicial: MinIO + Iceberg + Trino
  • ❌ CAQDAS apps em K8s
  • ❌ GraphRAG sobre corpus