FICHA · MANJARO

libexttextcat

Biblioteca de categorização textual por N-gramas para adivinhar idioma

  • Biblioteca
  • LIBRARY
  • LANGUAGE
  • TEXT
  • Só dependência
codex · reviewed · 28 de mai. de 2026 descrição em pt-br · fallback

Descrição

Biblioteca de categorização textual baseada em n-gramas, usada principalmente para estimar o idioma de um texto.

É infraestrutura de localização e processamento de texto. A detecção ajuda aplicativos a escolher dicionários, correção ortográfica ou comportamento específico de idioma, mas textos curtos ainda podem ser classificados incorretamente.

Permissões

Permissões ainda não analisadas para esta fonte.