Os LLMs de código aberto democratizaram o acesso a modelos de linguagem capazes que podem rodar em infraestrutura privada sem taxas de API ou compartilhamento de dados. Llama 3 e Gemma 2, da Meta e do Google, estabeleceram novos parâmetros de capacidade para pesos abertos. O Ollama torna a execução desses modelos localmente tão simples quanto um único comando, enquanto Together AI e Groq fornecem inferência em nuvem para equipes que precisam de modelos abertos em escala. A Hugging Face hospeda o ecossistema de modelos de código aberto, e o vLLM fornece o mecanismo de execução de alto throughput que sustenta muitas implantações.
1
4.9
2
4.8
3
4.8
4
4.8
5
4.7
6
4.7
7
4.6
8
4.5
9
4.5
10
4.4
11
4.3
12
4.0