FICHA · AUR

ollama-cuda12-bin

Cria, executa e compartilha LLMs com CUDA 12

  • llm-runtime
  • Linha de comando
  • SERVICE
  • AI
  • Abre direto
  • Serviço em segundo plano
codex · reviewed · 2 de jun. de 2026 descrição em pt-br · fallback

Descrição

Modelos de linguagem locais podem rodar com aceleração NVIDIA CUDA 12. Isso ajuda usuários a usar GPUs compatíveis para inferência de IA mais rápida e experimentação com modelos.

É uma variante binária do Ollama para sistemas CUDA 12. Verifique compatibilidade de driver, memória da GPU, licenças dos modelos e privacidade dos prompts antes de usar APIs locais ou expostas na rede.

Como rodar

ollama

Comandos: ollama

Permissões

Permissões ainda não analisadas para esta fonte.