FICHA · AUR

ollama-cuda12-bin

Cria, executa e compartilha LLMs com CUDA 12

llm-runtime
Linha de comando
SERVICE
AI
Abre direto
Serviço em segundo plano

codex · reviewed · 2 de jun. de 2026 descrição em pt-br · fallback

Descrição

Modelos de linguagem locais podem rodar com aceleração NVIDIA CUDA 12. Isso ajuda usuários a usar GPUs compatíveis para inferência de IA mais rápida e experimentação com modelos.

É uma variante binária do Ollama para sistemas CUDA 12. Verifique compatibilidade de driver, memória da GPU, licenças dos modelos e privacidade dos prompts antes de usar APIs locais ou expostas na rede.

Como rodar

ollama

Comandos: ollama

Permissões

Permissões ainda não analisadas para esta fonte.