A geração aumentada por recuperação (RAG) permite que a IA responda perguntas fundamentadas em seus próprios documentos, e não apenas nos dados de treinamento. LangChain e LlamaIndex são os frameworks mais usados para construir pipelines de RAG, conectando LLMs a bancos de dados vetoriais e carregadores de documentos. Pinecone e Weaviate fornecem os bancos de dados vetoriais especializados que tornam a recuperação semântica rápida em escala, enquanto as APIs da Anthropic e da OpenAI servem como a camada de modelo subjacente.
1
4.9
2
4.8
3
4.7
4
4.7
5
4.7
6
4.5
7
4.2
8
4.2