Falsch positive Ergebnisse

Mensch oder Maschine im Selbstversuch: Erkennen KI-Detektoren den Unterschied?

Robin Walter

Volontär

E-Mail zur Autorenseite

27.04.2025, 05:00 Uhr
KI-Detektoren versprechen zwischen von Menschen geschriebene Texte von KI-Texten unterscheiden zu können. Doch nicht alle Tools sind ehrlich mit den Nutzern.

© IMAGO/Rene Traut KI-Detektoren versprechen zwischen von Menschen geschriebene Texte von KI-Texten unterscheiden zu können. Doch nicht alle Tools sind ehrlich mit den Nutzern.

Chat-GPT und andere generative KI-Modelle haben viel auf den Kopf gestellt. Ein kurzer Kreativitätsboost von der KI oder die eigenen chaotischen Gedanken mit Chat-GPT in Form bringen lassen - der KI-Einsatz ist schnell, einfach und liefert beeindruckend gute Ergebnisse. Doch so ganz unbemerkt lassen sich die Large Language Modelle (LLM) von Open-AI und Co. nicht verwenden.

Auf TikTok zeigt der User Njklas seine ganz persönliche „Hölle“. Für seine Bewerbung bei einem neuen Job testete er sein Bewerbungsanschreiben auf KI-generierten Text. Klingt vielleicht im ersten Moment sinnfrei, einen selbstgeschriebenen Text auf KI-Merkmale zu prüfen. Njiklas hat es trotzdem getan und das Ergebnis hat ihm ganz und gar nicht gefallen.

So regeln Universitäten den Einsatz von KI

Auch immer mehr Arbeitgeber und Universitäten nutzen solche Tools, um KI-generierte von authentischen Inhalten zu unterscheiden. Diese Programme analysieren Satzbau, Text-Struktur, Wortwiederholungen und viele andere Parameter, die einen von einer KI erzeugten Text identifizieren sollen. Während man mit Chat-GPT-Texten in der Freundesgruppe vielleicht als schreibfaul gilt, so sehen Universitäten und Arbeitgeber die Verwendung von KI sehr kritisch.

An der Friedrich-Alexander-Universität Nürnberg-Erlangen (FAU) ist die Nutzung von Chat-GPT und anderen LLM klar geregelt: „Sofern künstliche Intelligenz nicht ausdrücklich erlaubt ist, stellt sie ein unzulässiges Hilfsmittel dar.“ Heißt: Wer beim KI-Schummeln erwischt wird, der bekommt eine 5,0 - nicht bestanden.

Was sind die gängigen KI-Detektoren?

Wer also KI zur Formulierungshilfe oder zur Recherche verwendet, der sollte aufpassen. Um auf Nummer sicher zu gehen, nutzen viele KI-Detektoren. Die bekanntesten Tools heißen „Undetectable“, „Originality“ oder „Scribbr“. Wenn diese Programme grünes Licht geben, dann kann der Text ohne Sorgen genutzt werden, oder?

@.njklas Gar kein Bock mehr auf diesen ganzen AI Kram wenn ich dir ehrlich bin #fyp #fy #ai #ki ♬ Originalton - Njklas

Bei Njklas sorgte der KI-Check eher zu mehr Verwirrung. Der von ihm selbst verfasste Bewerbungstest wird von der KI als „1 % Human“, also mit beinahe absoluter Sicherheit als KI-generiert eingestuft. Auf TikTok fragt sich der Nutzer also: „Das heißt, ich muss meinen selber geschriebenen Text nochmal durch eine KI hauen, um ihn menschlicher wirken zu lassen?“

Wie Njklas dachten auch wir uns „what the f*** is going on?“ und haben den Selbsttest wiederholt. Ausgangsmaterial: Ein alter Uni-Text von unserem Redakteur. Kein Meisterwerk, aber garantiert 100 Prozent menschlich. Die Ergebnisse von drei verschiedenen Tools: gemischt. Während uns „Originality“ die Menschlichkeit des Textes attestiert, wittert „Scribbr“ bereits zu 25 Prozent einen KI-Text. „Undetectable“ hingegen ist felsenfest davon überzeugt, dass der Text von einer KI stammen muss und glaubt nur zu einem Prozent daran, dass unser Text von einem Menschen geschrieben worden sei.

Tools wollen Texte „humanisieren“

Die KI-Erkenn-KIs scheinen sich unsicher zu sein. Das bedeutet jedoch nicht, dass unser Text zu sehr nach einer KI klinge. Schon unter Njklas TikTok sammeln sich die Kommentare, die den Detektoren Profitgier unterstellen. Ein User schreibt etwa: „Würde nicht auf die Tools hören, die direkt eine Humanisierung anbieten. Die verdienen ja Geld damit.“

Und tatsächlich, nachdem uns „Undetectable“ erklärt, dass unser Text zu 99 Prozent von einer KI stammen soll, bekommen wir die Möglichkeit, unseren Text zu „humanisieren“, sprich von der KI menschlicher schreiben zu lassen.

Das erkennt auch Njklas. In einem zweiten Video klärt er darüber auf und kritisiert, dass die Plattformen augenscheinlich nur ihren Service verkaufen wollen und so Nutzerinnen und Nutzer verunsichern. Letztendlich gibt keines dieser Tools seinen Nutzern 100-prozentige Beweise für oder gegen einen Einsatz von Text-KI. Auch Universitäten verlassen sich nicht allein auf die Einschätzung von KI-Detektoren, sondern auf die Erfahrung der Uni-Lektoren.

1 Kommentar