开源 LLM 使得功能强大的语言模型得以普及,这些模型可以在私有基础设施上运行,无需 API 费用或数据共享。来自 Meta 和 Google 的 Llama 3 和 Gemma 2 为开放权重能力树立了新的基准。Ollama 使本地运行这些模型变得像单条命令一样简单,而 Together AI 和 Groq 则为需要大规模使用开放模型的团队提供云端推理。Hugging Face 托管着开源模型生态系统,vLLM 则提供了为众多部署提供支持的高吞吐量服务引擎。
1
4.9
2
4.8
3
4.8
4
4.8
5
4.7
6
4.7
7
4.6
8
4.5
9
4.5
10
4.4
11
4.3
12
4.0