Plataformas de conteúdo gerado por usuários, redes sociais e empresas enfrentam o desafio de manter conteúdo nocivo fora de suas plataformas em escala. WebPurify e Besedo combinam classificação por IA com revisão humana para decisões de moderação mais sutis. A Lakera é especializada em proteger as próprias aplicações de IA contra injeção de prompts e jailbreaking, enquanto MonkeyLearn e GPTZero trazem capacidades de classificação de texto aplicáveis a pipelines de moderação.
1
4.5
2
4.4
3
4.3
4
4.3
5
4.3
6
4.2
7
4.2
8
4.1
9
4.0