Descrição
Métricas Prometheus para GPUs NVIDIA podem ser coletadas a partir da saída do nvidia-smi. Isso ajuda administradores a monitorar utilização da GPU, memória, temperatura e outros sinais de hardware em painéis e sistemas de alerta.
É um exportador de métricas. Ele normalmente roda como serviço em segundo plano e pode expor informações de hardware e carga de trabalho pela rede, então o acesso deve ser limitado a sistemas de monitoramento confiáveis.