Descrição
Modelos de linguagem locais podem rodar com aceleração NVIDIA CUDA 13 em sistemas compatíveis. Isso ajuda usuários a testar stacks CUDA mais novos para inferência de IA mais rápida.
É uma variante binária do Ollama para CUDA 13. Confirme suporte do driver, memória da GPU, licenciamento dos modelos e privacidade dos prompts antes de depender dele em cargas reais.