28. August 2025, 14:05 Uhr | Lesezeit: 3 Minuten
In einem Blog-Post schreibt OpenAI offen über die Sicherheitsvorkehrungen in ChatGPT. Diese dienen dazu, die Verwendung der Künstlichen Intelligenz für gefährliche und schädigende Ziele zu unterbinden. Zu diesem Zwecke können Mitarbeiter des Unternehmens Chats mitlesen – und im Ernstfall sogar an die Polizei weitergeben.
Künstliche Intelligenz hat sich als ein äußert hilfreiches Werkzeug erwiesen, das Fragen beantwortet, Arbeitsabläufe beschleunigt und manchmal einfach als Gesprächspartner dient. Die Technologie ist jedoch noch in den Anfängen und bietet an vielen Stellen noch keine ausreichenden Sicherheitsvorkehrungen, um Nutzer zu schützen. Eine Studie der Stanford University zeigt, dass der Einsatz von KI in der psychischen Gesundheitsversorgung gefährliche Folgen haben kann. In den USA verklagen Eltern den ChatGPT-Betreiber OpenAI, weil ihr Sohn sich eine Anleitung zum Selbstmord über die KI geholt haben soll.
Bei unmittelbarer Gefahr wird die Polizei eingeschaltet
OpenAI hat nun auf seinem eigenen Blog einen Artikel veröffentlicht, der Sicherheit für Nutzer der Plattform adressiert. Darin legt das Unternehmen erstmals offen, was mit den Chats passiert, in denen „wir Nutzer entdecken, die anderen Schaden zufügen wollen“. Ein Team von menschlichen Mitarbeitern prüft die markierten Inhalte und ist dazu autorisiert, Konten zu sperren. Des Weiteren schreibt OpenAI: „Wenn menschliche Prüfer feststellen, dass ein Fall eine unmittelbare Gefahr für die körperliche Unversehrtheit anderer darstellt, leiten wir ihn möglicherweise an die Strafverfolgungsbehörden weiter.“
In den FAQ zur Datennutzung in ChatGPT schreibt OpenAI recht deutlich, dass eigene Mitarbeiter und „vertrauenswürdige“ Dienstleister auf Nutzerinhalte zugreifen können. Die Gründe für Dateneinsicht können folgende sein:
- Untersuchung von Missbrauch oder Sicherheitsvorfällen
- Bereitstellung von Support
- Bearbeitung rechtlicher Angelegenheiten
- Verbesserung der Modellleistung (außer bei Opt-out)
Das Unternehmen weist ausdrücklich darauf hin, keine sensiblen Informationen weiterzugeben, die nicht überprüft oder verwendet werden sollen.
Explizit ausgeschlossen von der Weitergabe an die Polizei sind jedoch Chats, die Fälle von Selbstverletzung enthalten, „um die Privatsphäre der Menschen zu respektieren“. Angesichts der fatalen Folgen, die eine Unterhaltung mit ChatGPT haben kann, wenn die Sicherheitsvorkehrungen ausfallen, wirkt diese Aussage etwas befremdlich.
Auf Nachfrage wurde TECHBOOK von einem Agenten für OpenAI auf die Datenschutz-FAQ verwiesen. Bislang haben wir keine Antwort erhalten, wie das Unternehmen besser mit Fällen von Selbstverletzung umgehen möchte.
OpenAI verbessert Schutzmechanismen kontinuierlich
In seinem Blog-Artikel formuliert OpenAI konkrete Maßnahmen, mit denen es die bestehenden Probleme beheben möchte. Laut OpenAI funktionieren die Sicherheitsvorkehrungen am besten in kurzen Gesprächen. Bei längeren Austauschen „können Teile der Sicherheits-Trainings des Modells degradieren“. Durch längeres Hin und Her können Nutzer diese Schwäche dazu ausnutzen, den Schutz zu umgehen. Der Konzern arbeitet daran, die Schutzmechanismen auch in solchen Gesprächen zu erhalten.
Auch interessant: So verhindern Sie, dass ChatGPT Ihre Eingaben als Trainingsdaten verwendet
Auch kann es vorkommen, dass eigentlich blockierte Inhalte trotzdem erscheinen. Hier arbeitet OpenAI daran, dass der Filter die Schwere der Inhalte nicht unterschätzt.