Plattformen mit nutzergenerierten Inhalten, soziale Netzwerke und Unternehmen stehen alle vor der Herausforderung, schädliche Inhalte in großem Maßstab von ihren Plattformen fernzuhalten. WebPurify und Besedo kombinieren KI-Klassifizierung mit menschlicher Überprüfung für nuancierte Moderationsentscheidungen. Lakera spezialisiert sich auf den Schutz von KI-Anwendungen selbst vor Prompt-Injection und Jailbreaking, während MonkeyLearn und GPTZero Text-Klassifizierungsfähigkeiten bieten, die auf Moderations-Pipelines anwendbar sind.
1
4.5
2
4.4
3
4.3
4
4.3
5
4.3
6
4.2
7
4.2
8
4.1
9
4.0