Răspuns rapid
Majoritatea cititorilor pot învăța să recunoască ChatGPT într-un singur paragraf, după ce văd tiparul numit o dată. Acest ghid expune cele 12 semnături specifice, de ce apar, cum se compară Claude și Gemini și unde induc indiciile în eroare. Pentru a testa un paragraf față de aceleași semnale pe care le folosesc profesorii, lipește-l în instrumentul nostru Detector AI.
De ce are ChatGPT o semnătură de stil
ChatGPT scrie așa cum scrie dintr-un motiv. OpenAI a antrenat modelul pe o felie largă de text de pe internet și din cărți, apoi l-a reglat fin cu Reinforcement Learning from Human Feedback (RLHF). Evaluatorii umani au preferat în mod constant răspunsuri politicoase, echilibrate, structurate și atenuate. Modelul a învățat să scrie așa în mod implicit.
Aceeași preferință RLHF pentru rezultate de ajutor și inofensive a antrenat modelul să folosească vocabular sigur, simetrie atentă și un registru politicos. Rezultatul este text care se citește competent, dar previzibil. Amprenta apare la GPT-3.5, GPT-4 și GPT-4o, fiecare versiune mai nouă fiind ușor mai puțin evidentă, dar niciodată invizibilă.
Cele 12 indicii ChatGPT
1. Dependența de linii de pauză
ChatGPT adoră caracterul liniei de pauză. Mostrele independente de rezultate GPT-4 au în medie două până la patru linii de pauză la 500 de cuvinte. Scrierea tipică de la nivel universitar are mai puțin de una. Caută expresii parantetice marcate cu linii de pauză acolo unde o virgulă sau un punct ar face treaba. Exemplu: Proiectul a fost amânat, marcat cu linii de pauză în jurul lui în ciuda eforturilor echipei, până la sfârșitul lui august.
2. Deschiderea cu Certainly! sau I'm Here to Help
ChatGPT nu se poate opri din a fi politicos. Când primește o sarcină, deschide adesea cu Certainly!, Of course!, Absolutely! sau I'm here to help. Chiar și când promptul cere o ciornă, nu un răspuns de chat, reziduul registrului de asistent se strecoară. Un eseu formal care se deschide cu o afirmație de un rând este aproape întotdeauna o lipire-din-ChatGPT.
3. Delve Into
Verbul delve este rar în engleza colocvială. Până în 2024 era atât de supra-reprezentat în rezultatele ChatGPT încât cercetătorii au folosit doar frecvența lui ca semnal AI slab. Dacă un text de 500 de cuvinte folosește delve into o dată, ar putea fi coincidență. De două ori e suspect. De trei ori e o amprentă.
4. Tapestry Of
O rudă apropiată a lui delve. ChatGPT apelează la tapestry pentru a descrie orice e complex sau interconectat: a tapestry of experiences, a tapestry of cultures, a rich tapestry of voices. Metafora este funcțională, dar modelul se sprijină pe ea mult mai tare decât o fac autorii umani.
5. Navigating the Complexities
Expresia navigating the complexities (sau navigating the challenges, navigating the nuances) apare în aproximativ unul din douăzeci de eseuri ChatGPT pe teme sociale. Este o atenuare care semnalează profunzime fără a se angaja la o afirmație specifică. Autorii umani nativi aleg de obicei un verb concret în schimb.
6. In Today's Digital Age
Aproape orice prompt despre tehnologie, societate sau cultură declanșează in today's digital age ca deschidere. Variantele includ in our increasingly connected world și in the modern era. Expresia nu poartă nicio informație. Există pentru a îndulci modelul în paragraful său de deschidere.
7. Limbaj de atenuare
ChatGPT atenuează constant. It could be argued that, one might say, some experts believe, this could be seen as. Atenuarea este reziduu RLHF: evaluatorii umani au preferat răspunsuri care nu se angajau la afirmații puternice. Rezultatul este o proză care sună atentă, dar rareori ia o poziție.
8. Lungime uniformă a paragrafelor
Paragrafele ChatGPT se grupează în jurul a trei până la cinci propoziții fiecare. Deschide un răspuns de cinci paragrafe și măsoară: majoritatea paragrafelor vor fi la o propoziție una de cealaltă. Autorii umani oscilează de la paragrafe de un rând la unele de zece rânduri, în funcție de accent. Ritmul de metronom al ChatGPT este unul dintre cele mai puternice indicii care nu țin de vocabular.
9. Structuri de liste
Când are îndoieli, ChatGPT face puncte. Chiar și răspunsurile în proză sunt întrerupte de liste numerotate sau cu puncte, uneori pentru trei elemente care s-ar citi mai bine ca o singură propoziție. Gemini este mai rău pe această dimensiune, dar ChatGPT este în continuare mult peste reperul uman.
10. Argumente simetrice
Fiecare afirmație primește un contraargument. On one hand, on the other hand, while X is true, Y must also be considered. Simetria este atât de consecventă încât cercetătorii au folosit echilibrul-argumentului ca amprentă a modelului. Autorii umani aleg mai des o parte.
11. Încheierea cu In Conclusion
Un eseu uman real folosește rar expresia literală in conclusion. ChatGPT o folosește ca tranziție de încheiere implicită. Variantele includ to sum up, in summary, ultimately. Paragraful de încheiere reformulează apoi introducerea, în loc să adauge o nouă perspectivă.
12. Ton excesiv de politicos în orice registru
Fie că promptul cere un tweet sarcastic, o scrisoare de intenție formală sau o postare de blog relaxată, ChatGPT revine la un registru politicos, neutru, profesional. Sarcasmul autentic, opinia tăioasă și frustrarea neatenuată sunt rare în rezultatul implicit. Platitudinea este cea care dă de gol. Autorii reali au stări. ChatGPT are o singură stare.
ChatGPT vs Claude vs Gemini: diferențe de stil
Cele trei mari modele de frontieră împart un reper de variație mică a lungimii și repetarea vocabularului, dar fiecare are propria amprentă.
- ChatGPT: Verbos, plin de linii de pauză, predispus la atenuare, deschideri politicoase, delve și tapestry, finaluri cu in conclusion.
- Claude: Ritm chibzuit, mai puține clișee fixe, mai multă autocorectare (de ex. actually, on reflection), totuși lungime uniformă a paragrafelor, preferă virgulele în locul liniilor de pauză.
- Gemini: Enumerat, plin de tabele, condus de liste, deschide adesea cu un răspuns direct de un rând, apoi puncte, amprentă structurală puternică.
- Toate trei împart: Variație mică a lungimii, repetarea vocabularului în 500 de cuvinte, argumente simetrice, exemple generice.
Detectarea GPT-4 vs GPT-3.5
GPT-3.5 își poartă indiciile la vedere. Structura de eseu de cinci paragrafe, două delve-uri, patru linii de pauză și un final cu in conclusion apar într-o ciornă tipică de 500 de cuvinte. GPT-4 este mai greu. Folosirea liniilor de pauză scade ușor, atenuarea este mai nuanțată, iar clișeele apar mai rar. GPT-4o îndulcește și mai mult deschiderile politicoase.
Dar semnalul statistic profund rămâne. Variația lungimii rămâne mică. Lungimea paragrafelor rămâne uniformă. Folosirea liniilor de pauză rămâne ridicată. Certainly! tot se strecoară. Cercetătorii care au rulat detectarea de benchmark pe GPT-4o (Mitchell et al. și lucrările ulterioare din 2024) au constatat că cele mai puternice detectoare semnalează în continuare textul GPT-4o mult peste reperul uman. Indiciile au migrat, dar nu au dispărut.
Demonstrație live: trece acest text prin detectorul nostru
Iată o mostră de 110 cuvinte scrisă de GPT-4 din promptul write a short paragraph about remote work:
In today's digital age, remote work has fundamentally transformed the way professionals navigate the complexities of their careers. While it offers a tapestry of benefits, including increased flexibility and the ability to delve into a healthier work-life balance, it also presents challenges, such as feelings of isolation and difficulty separating personal and professional life. Companies must adopt robust frameworks to support their distributed teams, leveraging communication tools and fostering a culture of trust. Ultimately, the future of work is ever-evolving, and organizations that embrace this shift while addressing its complexities will thrive in an increasingly interconnected world. In conclusion, remote work is here to stay.
Lipește acel paragraf în Detectorul nostru AIși verdictul revine Aproape sigur AI în mai puțin de o secundă. Detectorul semnalează șase expresii clișeu (in today's digital age, navigating the complexities, tapestry of, delve into, robust framework, leveraging, ever-evolving, in conclusion), variație mică a lungimii (propozițiile se grupează între 18 și 28 de cuvinte) și simetrie structurală (introducere, listă de beneficii, listă de provocări, concluzie). Fiecare este un indiciu din lista de mai sus.
Când aceste indicii induc în eroare
Cele 12 indicii produc false pozitive în trei genuri notabile.
- Rezumate academice. Rezumatele de articole sunt formale, atenuate, simetrice și pline de vocabular sigur. Arată precum ChatGPT pentru că sunt scrise după aceleași constrângeri: concizie, echilibru și neutralitate.
- Documentație tehnică și juridică. Specificațiile, notele de politică și memoriile juridice prețuiesc atenuarea și simetria în mod deliberat. Un scor AI mare pe un contract este de obicei un fals pozitiv.
- Autori de engleză non-nativi. Liang et al. (Stanford 2023) au constatat că detectoarele GPT au semnalat 61% dintre eseurile TOEFL ale vorbitorilor de engleză non-nativi drept generate de AI. Vocabularul formal, simetria atentă și atenuarea sunt caracteristice englezei academice de a doua limbă.
Cele 12 indicii sunt cele mai fiabile pe eseurile de elevi, ciornele de blog, postările pe rețelele sociale, textul de marketing și corespondența personală. Folosește-le ca semnale de investigat, nu ca dovadă în sine. Dacă ești profesor sau editor, combină mai multe indicii înainte de a trage o concluzie. Dacă ești un autor îngrijorat de falsele pozitive, citește ghidul nostru complementar despre cum să umanizezi text AI pentru tehnicile care rezolvă semnalul de bază, nu doar cuvintele de suprafață.
Verificarea de 30 de secunde
Când suspectezi că ChatGPT a scris ceva, rulează asta în ordine.
- Numără caracterele liniei de pauză în primele 200 de cuvinte.
- Caută delve, tapestry, navigating, in today's digital age.
- Măsoară varianța lungimii paragrafelor. Un grup strâns în jurul a 3 până la 5 propoziții este un semnal.
- Caută argumente simetrice și expresia in conclusion.
- Lipește textul în Detectorul nostru AI gratuit pentru a puncta automat aceleași semnale.
Două sau trei potriviri în 30 de secunde sunt suficiente pentru a identifica fiabil rezultatele ChatGPT. Adaugă un scor mare de detector și cazul este practic închis.
Sources
- Mitchell, E., Lee, K., Khazatsky, A., Manning, C.D., & Finn, C. (2023). DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature. Stanford University.
- Gehrmann, S., Strobelt, H., & Rush, A.M. (2019). GLTR: Statistical Detection and Visualization of Generated Text. Harvard NLP / MIT-IBM Watson AI Lab.
- OpenAI (2024). GPT-4 System Card and GPT-4o Technical Report.
- Anthropic (2024). Claude 3 Model Family Documentation and Constitutional AI Principles.