Szybka odpowiedź
Większość czytelników może nauczyć się rozpoznawać ChatGPT w jednym akapicie po tym, jak raz usłyszy nazwany wzorzec. Ten przewodnik przedstawia 12 konkretnych sygnatur, dlaczego się pojawiają, jak wypadają Claude i Gemini oraz gdzie ślady wprowadzają w błąd. Aby przetestować akapit wobec tych samych sygnałów, których używają nauczyciele, wklej go do naszego Detektora AI.
Dlaczego ChatGPT ma sygnaturę stylu
ChatGPT pisze tak, jak pisze, z konkretnego powodu. OpenAI trenowało model na szerokim wycinku tekstu z internetu i książek, a potem dostroiło go uczeniem ze wzmocnieniem na podstawie informacji zwrotnej od ludzi (RLHF). Oceniający ludzie konsekwentnie preferowali odpowiedzi uprzejme, zrównoważone, ustrukturyzowane i asekuracyjne. Model nauczył się tak pisać domyślnie.
Ta sama preferencja RLHF dla pomocnego i nieszkodliwego wyjścia nauczyła model używać bezpiecznego słownictwa, starannej symetrii i uprzejmego rejestru. Rezultatem jest tekst, który czyta się kompetentnie, ale przewidywalnie. Odcisk palca pojawia się w GPT-3.5, GPT-4 i GPT-4o, przy czym każda nowsza wersja jest nieco mniej oczywista, ale nigdy niewidoczna.
12 śladów ChatGPT
1. Uzależnienie od myślnika
ChatGPT uwielbia znak myślnika. Niezależne próbki wyjścia GPT-4 mają średnio dwa do czterech myślników na 500 słów. Typowe pisanie studenta ma mniej niż jeden. Szukaj wtrąceń wydzielonych myślnikami tam, gdzie przecinek lub kropka załatwiłyby sprawę.
2. Otwieranie od Oczywiście! lub Chętnie pomogę
ChatGPT nie potrafi przestać być uprzejmy. Postawiony przed zadaniem często otwiera od Oczywiście!, Jasne!, Zdecydowanie! lub Chętnie pomogę. Nawet gdy polecenie prosi o szkic, a nie odpowiedź w czacie, przebija się pozostałość rejestru asystenta. Formalny esej otwierany jednolinijkowym potwierdzeniem to niemal zawsze wklejenie z ChatGPT.
3. Zagłębić się
Czasownik zagłębić jest rzadki w swobodnej angielszczyźnie. Do 2024 roku był tak nadreprezentowany w wyjściu ChatGPT, że badacze używali samej jego częstości jako słabego sygnału AI. Jeśli tekst na 500 słów używa zagłębić się raz, to może być przypadek. Dwa razy to podejrzane. Trzy razy to odcisk palca.
4. Gobelin czegoś
Bliski kuzyn zagłębić. ChatGPT sięga po gobelin, by opisać cokolwiek złożonego lub powiązanego: gobelin doświadczeń, gobelin kultur, bogaty gobelin głosów. Metafora jest funkcjonalna, ale model opiera się na niej znacznie mocniej niż ludzcy autorzy.
5. Poruszanie się po zawiłościach
Zwrot poruszanie się po zawiłościach (lub poruszanie się po wyzwaniach, po niuansach) pojawia się w mniej więcej jednym na dwadzieścia esejów ChatGPT na tematy społeczne. To asekuracja, która sygnalizuje głębię bez zobowiązania do konkretnego twierdzenia. Rodzimi ludzcy autorzy zwykle wybierają konkretny czasownik.
6. W dzisiejszej erze cyfrowej
Niemal każde polecenie o technologii, społeczeństwie lub kulturze wyzwala w dzisiejszej erze cyfrowej jako otwarcie. Warianty to w naszym coraz bardziej połączonym świecie i w nowoczesnej erze. Zwrot nie niesie informacji. Istnieje, by łagodnie wprowadzić model w akapit otwierający.
7. Język asekuracji
ChatGPT asekuruje się nieustannie. Można argumentować, że, można by powiedzieć, niektórzy eksperci uważają, można to postrzegać jako. Asekuracja to pozostałość RLHF: oceniający ludzie preferowali odpowiedzi, które nie zobowiązywały się do mocnych twierdzeń. Rezultatem jest proza, która brzmi ostrożnie, ale rzadko zajmuje stanowisko.
8. Jednolita długość akapitów
Akapity ChatGPT skupiają się wokół trzech do pięciu zdań każdy. Otwórz odpowiedź pięcioakapitową i zmierz: większość akapitów wypadnie w granicach jednego zdania od siebie. Ludzcy autorzy wahają się od jednolinijkowych akapitów do dziesięciolinijkowych w zależności od podkreślenia. Metronomiczny rytm ChatGPT to jeden z najgłośniejszych śladów spoza słownictwa.
9. Struktury list
W razie wątpliwości ChatGPT robi punkty. Nawet odpowiedzi prozą są przerywane numerowanymi lub punktowanymi listami, czasem dla trzech elementów, które lepiej czytałyby się jako jedno zdanie. Gemini jest gorszy w tym wymiarze, ale ChatGPT i tak jest daleko powyżej ludzkiego punktu odniesienia.
10. Symetryczne argumenty
Każde twierdzenie dostaje kontr. Z jednej strony, z drugiej strony, choć X jest prawdą, trzeba też rozważyć Y. Symetria jest tak spójna, że badacze używali równowagi argumentów jako odcisku palca modelu. Ludzcy autorzy częściej wybierają stronę.
11. Zamykanie od Podsumowując
Prawdziwy ludzki esej rzadko używa dosłownego zwrotu podsumowując. ChatGPT używa go jako domyślnego przejścia zamykającego. Warianty to reasumując, w skrócie, ostatecznie. Akapit zamykający potem powtarza wstęp, zamiast dodawać nowy wgląd.
12. Nadmiernie uprzejmy ton w każdym rejestrze
Niezależnie od tego, czy polecenie prosi o złośliwy tweet, formalny list motywacyjny czy swobodny wpis na blogu, ChatGPT domyślnie przyjmuje uprzejmy, neutralny, profesjonalny rejestr. Szczera złośliwość, ostra opinia i nieasekurowana frustracja są rzadkie w domyślnym wyjściu. Ta płaskość to zdradzenie. Prawdziwi autorzy mają nastroje. ChatGPT ma jeden nastrój.
ChatGPT kontra Claude kontra Gemini: różnice stylu
Wielka trójka modeli czołowych dzieli niski punkt wyjścia zmienności i powtarzanie słownictwa, ale każdy ma własny odcisk palca.
- ChatGPT: Rozwlekły, ciężki od myślników, skłonny do asekuracji, uprzejme otwarcia, zagłębić i gobelin, zakończenia podsumowując.
- Claude: Przemyślane tempo, mniej ustalonych frazesów, więcej samokorekty (np. właściwie, po namyśle), wciąż jednolita długość akapitów, woli przecinki od myślników.
- Gemini: Wyliczeniowy, ciężki od tabel, napędzany listami, często otwiera jednolinijkową bezpośrednią odpowiedzią, a potem punktami, silny strukturalny odcisk palca.
- Wszystkie trzy dzielą: Niską zmienność, powtarzanie słownictwa w obrębie 500 słów, symetryczne argumenty, ogólnikowe przykłady.
Wykrywanie GPT-4 kontra GPT-3.5
GPT-3.5 nosi swoje ślady na widoku. Struktura eseju pięcioakapitowego, dwa zagłębić, cztery myślniki i zakończenie podsumowując pojawiają się w typowym szkicu na 500 słów. GPT-4 jest trudniejszy. Użycie myślnika lekko spada, asekuracja jest bardziej zniuansowana, a frazesy pojawiają się rzadziej. GPT-4o jeszcze bardziej łagodzi uprzejme otwarcia.
Ale głęboki sygnał statystyczny pozostaje. Zmienność pozostaje niska. Długość akapitów pozostaje jednolita. Użycie myślnika pozostaje podwyższone. Oczywiście! nadal się przebija. Badacze prowadzący testy wykrywania na GPT-4o (Mitchell i in. oraz dalsze prace z 2024 roku) odkryli, że najsilniejsze detektory wciąż oznaczają tekst GPT-4o znacznie powyżej ludzkiego punktu odniesienia. Ślady migrowały, ale nie zniknęły.
Demo na żywo: przepuść ten tekst przez nasz detektor
Oto próbka na 110 słów napisana przez GPT-4 z polecenia napisz krótki akapit o pracy zdalnej:
W dzisiejszej erze cyfrowej praca zdalna gruntownie przekształciła sposób, w jaki profesjonaliści poruszają się po zawiłościach swoich karier. Choć oferuje gobelin korzyści, w tym większą elastyczność i możliwość zagłębienia się w zdrowszą równowagę między pracą a życiem, niesie też wyzwania, takie jak poczucie izolacji i trudność w oddzieleniu życia osobistego od zawodowego. Firmy muszą przyjąć solidne ramy, by wspierać swoje rozproszone zespoły, wykorzystując narzędzia komunikacji i pielęgnując kulturę zaufania. Ostatecznie przyszłość pracy nieustannie ewoluuje, a organizacje, które przyjmą tę zmianę, rozkwitną w coraz bardziej połączonym świecie. Podsumowując, praca zdalna zostanie z nami na dłużej.
Wklej ten akapit do naszego Detektora AI, a werdykt wraca jako Niemal na pewno AI w mniej niż sekundę. Detektor oznacza sześć frazesów (w dzisiejszej erze cyfrowej, poruszanie się po zawiłościach, gobelin, zagłębić się, solidne ramy, wykorzystując, nieustannie ewoluujący, podsumowując), niską zmienność (zdania skupiają się między 18 a 28 słów) i symetrię strukturalną (wstęp, lista korzyści, lista wyzwań, zakończenie). Każdy to ślad z listy powyżej.
Kiedy te ślady wprowadzają w błąd
12 śladów daje fałszywe alarmy w trzech istotnych gatunkach.
- Abstrakty akademickie. Abstrakty czasopism są formalne, asekuracyjne, symetryczne i naładowane bezpiecznym słownictwem. Wyglądają jak ChatGPT, bo są pisane do tych samych ograniczeń: zwięzłości, równowagi i neutralności.
- Dokumentacja techniczna i prawna. Specyfikacje, notatki dotyczące zasad i memoranda prawne cenią asekurację i symetrię celowo. Wysoki wynik AI na umowie to zwykle fałszywy alarm.
- Autorzy nieanglojęzyczni. Liang i in. (Stanford 2023) wykazali, że detektory GPT oznaczyły 61% esejów TOEFL osób nieanglojęzycznych jako generowane przez AI. Formalne słownictwo, staranna symetria i asekuracja są charakterystyczne dla drugojęzycznej angielszczyzny akademickiej.
12 śladów jest najbardziej wiarygodne na esejach uczniów, szkicach blogowych, postach społecznościowych, tekstach marketingowych i korespondencji osobistej. Używaj ich jako sygnałów do zbadania, a nie dowodu samego w sobie. Jeśli jesteś nauczycielem lub redaktorem, połącz wiele śladów, zanim wyciągniesz wniosek. Jeśli jesteś autorem obawiającym się fałszywych alarmów, przeczytaj nasz towarzyszący przewodnik o humanizacji tekstu AI po techniki, które naprawiają leżący u podstaw sygnał, a nie tylko słowa na powierzchni.
Sprawdzenie w 30 sekund
Gdy podejrzewasz, że coś napisał ChatGPT, przeprowadź to po kolei.
- Policz znaki myślnika w pierwszych 200 słowach.
- Przeskanuj pod kątem zagłębić, gobelin, poruszanie się, w dzisiejszej erze cyfrowej.
- Zmierz wariancję długości akapitów. Ciasne skupienie wokół 3 do 5 zdań to sygnał.
- Szukaj symetrycznych argumentów i zwrotu podsumowując.
- Wklej tekst do naszego darmowego Detektora AI, by ocenić te same sygnały automatycznie.
Dwa lub trzy dopasowania w 30 sekund wystarczą, by niezawodnie zidentyfikować wyjście ChatGPT. Dodaj wysoki wynik detektora i sprawa jest praktycznie zamknięta.
Źródła
- Mitchell, E., Lee, K., Khazatsky, A., Manning, C.D., & Finn, C. (2023). DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature. Stanford University.
- Gehrmann, S., Strobelt, H., & Rush, A.M. (2019). GLTR: Statistical Detection and Visualization of Generated Text. Harvard NLP / MIT-IBM Watson AI Lab.
- OpenAI (2024). GPT-4 System Card and GPT-4o Technical Report.
- Anthropic (2024). Claude 3 Model Family Documentation and Constitutional AI Principles.