Detector AI

Verifică dacă textul tău a fost scris de ChatGPT, Claude, Gemini sau GPT-4.

Gratuit. Instant. Fără înregistrare. Fără încărcare. Rulează în întregime în browserul tău.

✓ Detectare ChatGPT✓ Detectare Claude✓ GPT-4 / GPT-4o✓ 100% privat
0 cuvinte · 0 propoziții

Toată analiza rulează în browserul tău. Textul tău nu părăsește niciodată dispozitivul tău.

Scor de probabilitate AI
0din 100
Incert

Semnalele sunt mixte. Nu se poate decide într-un sens sau altul.

Pe baza a 6 semnale

Cum funcționează acest detector

Acest instrument combină șase semnale statistice într-un singur scor de probabilitate AI de la 0 la 100. Fiecare semnal este calculat local în browserul tău folosind metode consacrate de analiză a textului. Semnalele sunt ponderate în funcție de cât de fiabil disting textul generat de AI de scrierea umană în literatura de cercetare.

Variația lungimii (30%) măsoară coeficientul de variație al lungimii propozițiilor. Scrierea umană oscilează între propoziții scurte și lungi; textul AI este mai uniform. Diversitatea vocabularului (20%) folosește raportul tip-token cu o fereastră de 100 de cuvinte. Detectarea clișeelor (20%) caută expresii tipice AI precum "delve into", "in today's digital age" și "in conclusion". Profilul punctuației (15%) urmărește densitatea liniilor de pauză, a punctelor și virgulelor și a virgulei Oxford. Structura propozițiilor (10%) analizează variația începuturilor și rata diatezei pasive. Repetarea (5%) numără expresiile repetate de 3 și 4 cuvinte.

Detectorul este calibrat să favorizeze falsele pozitive în detrimentul falselor negative la capătul de jos al scorului: un scor de 30 înseamnă totuși "înclină spre uman", nu "sigur uman". Tratează verdictul ca pe un punct de plecare, nu ca pe o sentință.

O euristică, nu o sentință

Aceasta este o estimare statistică, nu o dovadă. Detectarea AI este intrinsec incertă. Instrumente ca acesta pot produce false pozitive pentru scrierea academică, engleza non-nativă, documentația tehnică și stilurile formale. Nu folosi acest lucru drept singura bază pentru acuzații de plagiat sau necinste academică.

Răspuns rapid

Lipește cel puțin 50 de cuvinte. Instrumentul calculează șase semnale statistice (variația lungimii, diversitatea vocabularului, expresii clișeu, punctuație, structura propozițiilor, repetare) și le combină într-un scor de probabilitate AI de la 0 la 100. Acuratețea euristică este de aproximativ 65 până la 75 la sută. Tratează rezultatele ca pe un punct de plecare, nu ca pe o dovadă.

Cum funcționează detectarea AI

Detectoarele AI euristice nu îți "citesc" textul. Numără trăsături de suprafață care tind să difere între scrierea umană și cea AI. Nicio trăsătură nu este un indiciu de la sine, motiv pentru care detectoarele robuste combină mai multe semnale. Mai jos sunt cele șase pe care le folosește acest instrument.

1. Variația lungimii (burstiness)

Variația lungimii măsoară diferențele de lungime a propozițiilor de-a lungul unui pasaj. Oamenii oscilează natural între propoziții foarte scurte (3 până la 6 cuvinte) și unele lungi (25 până la 40 de cuvinte). Modelele mari de limbaj, antrenate să optimizeze fluența și claritatea, produc propoziții care se grupează în jurul unei medii de 15 până la 22 de cuvinte, cu variație mică. Instrumentul calculează coeficientul de variație: o valoare peste 0,6 înclină spre uman, sub 0,3 înclină spre AI. Variația lungimii este cel mai puternic semnal în majoritatea benchmark-urilor de cercetare, motiv pentru care îi atribuim o pondere de 30 la sută.

2. Diversitatea vocabularului

Diversitatea vocabularului este măsurată cu raportul tip-token: cuvinte unice împărțite la cuvinte totale. Pentru a stabiliza metrica pe diferite lungimi de text, folosim o fereastră mobilă de 100 de cuvinte și calculăm media TTR per fereastră. Scrierea umană se situează de obicei la 0,65 până la 0,80 pe această măsură. Rezultatul AI se grupează adesea la 0,55 până la 0,65, reflectând tendința modelului de a reutiliza vocabularul într-un pasaj. Pondere: 20 la sută.

3. Detectarea clișeelor n-gram

Căutăm o listă curatată de expresii pe care modelele AI le folosesc excesiv: "in today's digital age", "it is important to note", "delve into", "navigate the complexities", "in conclusion", "furthermore", "moreover", "additionally" și altele. Aceste expresii nu sunt greșite în sine, dar densitatea lor într-un pasaj este un semnal puternic. Una la fiecare 50 de cuvinte împinge scorul către AI. Pondere: 20 la sută.

4. Profilul punctuației

Modelele AI, în special familia GPT-4, folosesc excesiv liniile de pauză (caracterul de liniuță lungă). Majoritatea autorilor umani folosesc liniile de pauză cu moderație. Instrumentul numără liniile de pauză la 100 de cuvinte, densitatea punctelor și virgulelor și rata de folosire a virgulei Oxford. Un pasaj cu trei linii de pauză în 200 de cuvinte este un marker AI puternic de la sine. Pondere: 15 la sută.

5. Structura propozițiilor

Două trăsături structurale: cât de des încep propozițiile cu același cuvânt (variația mică înclină spre AI) și cât de des apare diateza pasivă (rata mare înclină spre AI). Detectorul aproximează diateza pasivă căutând verbe "a fi" (era, erau, este, sunt, fost, fiind) urmate în trei cuvinte de un participiu probabil. Pondere: 10 la sută.

6. Repetarea expresiilor

Extragem fiecare expresie de 3 și 4 cuvinte din text și numărăm repetările. Expresiile care apar de trei sau mai multe ori împing scorul către AI. Oamenii parafrazează de obicei; AI se zbuciumă pe tipare. Acesta este cel mai slab dintre cele șase semnale (5 la sută), pentru că scrierea legitimă repetă adesea terminologia, dar adaugă informații utile la margini.

Acuratețe și limitări

Evaluările independente ale detectoarelor AI euristice (GPTZero, ZeroGPT, Copyleaks și detectoare academice precum DetectGPT și GLTR) ajung în mod constant în intervalul de 65 până la 80 la sută acuratețe pe text din domenii mixte. Aceleași studii arată că rezultatele AI editate ușor pot scădea rata de detectare sub 50 la sută. Nu există niciun detector, cu plată sau gratuit, care să depășească 90 la sută pe text adversarial.

Instrumentul nostru va produce false pozitive pentru:

  • Scriere academică - lungime uniformă a propozițiilor, vocabular formal, limbaj de atenuare.
  • Engleză non-nativă - vocabular de lucru mai mic, mai multe structuri repetate.
  • Documentație tehnică - diateza pasivă, terminologie repetată, stil formal.
  • Text corporativ sau juridic - expresii clișeu, virgule Oxford, folosirea punctelor și virgulelor.
  • Scriere puternic editată sau pe șablon - tipare care par mecanice pentru că sunt.

Folosește scorul ca punct de pornire pentru discuții, niciodată ca verdict. Pentru decizii cu miză mare (sancțiuni academice, angajări), combină detectorul cu alte dovezi: istoricul ciornelor, mostre de scriere, o conversație în persoană despre conținut.

Când să folosești detectarea AI

Există cazuri reale de utilizare pentru un detector euristic, atâta timp cât înțelegi limitele:

  • Profesori care verifică eseurile elevilor pentru o triere rapidă înainte de o analiză mai profundă. Un scor mare semnalează "uită-te mai atent", nu "picat".
  • Editori care verifică munca freelancerilor pentru a confirma că un autor livrează vocea umană pentru care a fost angajat.
  • Recrutori care analizează scrisori de intenție ca un element printre multe altele. Un scor de 95 pe o scrisoare de intenție este un steag galben care merită urmărit.
  • Auto-verificare înainte de publicare pentru a depista pasajele care citesc ca ChatGPT și a le rescrie în vocea ta.
  • Audituri de autenticitate a conținutului când analizezi un teanc de articole trimise, postări de blog sau texte de produs.

Comparație cu alte detectoare

Există mai multe detectoare AI cunoscute, fiecare cu compromisuri diferite:

  • GPTZero folosește perplexitatea și variația lungimii cu modele proprietare. Nivel gratuit cu limite, planuri cu plată pentru volum mai mare.
  • Originality.ai este doar cu plată și vizează editorii SEO. Folosește un clasificator antrenat personalizat.
  • ZeroGPT este gratuit cu un nivel plătit. Folosește perplexitatea și variația lungimii similar cu GPTZero.
  • Copyleaks este axat pe nivel enterprise, cu detectare de plagiat plus AI într-un singur produs.

Instrumentul nostru este gratuit, complet în browser, nu necesită înregistrare și nu îți vede niciodată textul. Nu pretinde că depășește opțiunile cu plată. Beneficiul este confidențialitatea și lipsa de fricțiune. Dacă ai nevoie de mai multă încredere pentru o singură decizie critică, un detector cu plată este rezonabil. Pentru trierea zilnică, un instrument euristic transparent este de obicei suficient.

Întrebări Frecvente

Instrumentul combină șase semnale statistice într-un scor de probabilitate AI de la 0 la 100: variația lungimii (variația lungimii propozițiilor), diversitatea vocabularului, expresii clișeu tipice AI, profilul punctuației (densitatea liniilor de pauză, a punctelor și virgulelor, a virgulei Oxford), structura propozițiilor (variația începuturilor și rata diatezei pasive) și repetarea expresiilor de 3 și 4 cuvinte. Fiecare semnal este ponderat după cât de fiabil distinge AI de scrierea umană în literatura de cercetare. Toate calculele se fac în browserul tău.

Nu. Niciun detector AI nu este 100% precis, inclusiv servicii cu plată precum GPTZero, Originality.ai și ZeroGPT. Studiile independente arată că detectoarele euristice ajung la aproximativ 65 până la 75 la sută acuratețe pe text mixt. Scorul nostru este un punct de plecare, nu un verdict. Tratează scorurile sub 30 ca 'înclină spre uman', 30 până la 70 ca 'incert' și peste 70 ca 'înclină spre AI'. Nu folosi niciodată scorul unui detector ca singura bază pentru acuzații de plagiat sau necinste academică.

Semnalele pe care le urmărim (expresii clișeu precum 'delve into', folosirea masivă a liniilor de pauză, lungimi uniforme ale propozițiilor) sunt cele mai pronunțate în rezultatele GPT-3.5 și GPT-4. Claude tinde să producă lungimi mai variate ale propozițiilor și mai puține expresii standard, deci textul său obține adesea scoruri mai mici. Gemini se află la mijloc. Instrumentul nu este reglat pentru un anumit model. Caută semnături statistice generale ale textului generat de LLM, motiv pentru care rezultatele AI editate sau puternic ghidate prin prompt pot scăpa sub prag.

Detectoarele euristice caută tipare statistice, nu autori. Mai multe tipuri de scriere împart tipare cu AI: lucrările academice (lungime uniformă a propozițiilor, vocabular formal), engleza non-nativă (vocabular limitat, structuri repetate), documentația tehnică (diateza pasivă, terminologie repetată) și textul corporativ sau juridic (expresii clișeu, punctuație formală). Dacă scrii într-un stil măsurat și consecvent, poți obține un scor mai mare decât te-ai aștepta. Detectorul nu 'știe' nimic dincolo de trăsăturile de suprafață pe care le numără.

Nu. Toată analiza rulează local în browserul tău folosind JavaScript. Textul tău nu părăsește niciodată dispozitivul, nu este încărcat, nu este înregistrat și nu este folosit pentru a antrena vreun model. Poți verifica acest lucru deschizând instrumentele de dezvoltare ale browserului și urmărind fila de rețea în timpul analizei: nu există trafic de rețea. De asemenea, nu îți stocăm textul pe serverele noastre, pentru că nu avem acces la el în primul rând.

Șase semnale: (1) Variația lungimii, coeficientul de variație al lungimii propozițiilor. (2) Diversitatea vocabularului, măsurată prin raportul tip-token cu o fereastră mobilă de 100 de cuvinte. (3) Detectarea clișeelor n-gram, căutând expresii standard AI precum 'in today's digital age' și 'it is important to note'. (4) Profilul punctuației, urmărind densitatea liniilor de pauză, a punctelor și virgulelor și a virgulei Oxford. (5) Structura propozițiilor, măsurând variația începuturilor și rata diatezei pasive. (6) Repetarea expresiilor, numărând expresii de 3 și 4 cuvinte care apar de trei sau mai multe ori.

Da, și ușor. Editarea ușoară a rezultatelor AI (înlocuirea expresiilor clișeu, spargerea propozițiilor lungi și uniforme, adăugarea unei voci personale și a contracțiilor) va reduce semnificativ scorul. Aceasta este o limitare fundamentală a fiecărui detector euristic. Aceleași editări care păcălesc instrumentul nostru vor păcăli și GPTZero și ZeroGPT. Dacă trebuie să verifici autorul pentru o decizie cu miză mare, combină un detector cu alte dovezi: istoricul scrierii, verificarea în persoană, istoricul ciornelor în Google Docs sau Word și o conversație directă despre conținut.

Surse

  • Mitchell, E., Lee, Y., Khazatsky, A., Manning, C. D., Finn, C. (2023). "DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature." Proceedings of the 40th International Conference on Machine Learning.
  • Solaiman, I., Brundage, M., Clark, J., et al. (2019). "Release Strategies and the Social Impacts of Language Models." OpenAI Report.
  • Gehrmann, S., Strobelt, H., Rush, A. M. (2019). "GLTR: Statistical Detection and Visualization of Generated Text." ACL System Demonstrations.
  • Bhattacharjee, A., Liu, H. (2023). "Fighting Fire with Fire: Can ChatGPT Detect AI-generated Text?" SIGKDD Explorations Newsletter.
  • GPTZero (2023). "How AI Text Detectors Work." Documentație publică despre metodologie.