Détecteur d'IA

Vérifiez si votre texte a été écrit par ChatGPT, Claude, Gemini ou GPT-4.

Gratuit. Instantané. Sans inscription. Sans téléversement. Fonctionne dans votre navigateur.

✓ Détection ChatGPT✓ Détection Claude✓ GPT-4 / GPT-4o✓ 100 % privé

0 mots · 0 phrases

Toute l'analyse s'execute dans votre navigateur. Votre texte ne quitte jamais votre appareil.

Score de probabilite d'IA

0sur 100

Incertain

Les signaux sont mitiges. Impossible de trancher.

Base sur 6 signaux

Comment fonctionne ce detecteur

Cet outil combine six signaux statistiques en un seul score de probabilite d'IA de 0 a 100. Chaque signal est calcule localement dans votre navigateur avec des methodes d'analyse de texte eprouvees. Les signaux sont ponderes selon leur fiabilite a distinguer le texte genere par IA de l'ecriture humaine dans la litterature scientifique.

Variabilite (30%) mesure le coefficient de variation de la longueur des phrases. L'ecriture humaine alterne phrases courtes et longues ; la production d'IA est plus uniforme. Diversite du vocabulaire (20%) utilise le ratio type-token avec une fenetre de 100 mots. Detection de cliches (20%) recherche des tournures typiques de l'IA comme "approfondir", "a l'ere numerique actuelle" et "en conclusion". Profil de ponctuation (15%) suit la densite des tirets longs, points-virgules et virgules d'Oxford. Structure des phrases (10%) examine la variation des debuts et le taux de voix passive. Repetition (5%) compte les phrases repetees de 3 et 4 mots.

Le detecteur est calibre pour privilegier les faux positifs plutot que les faux negatifs dans le bas de l'echelle : un score de 30 signifie encore "plutot humain" plutot que "definitivement humain". Traitez le verdict comme un point de depart, pas comme une conclusion.

Une heuristique, pas un verdict

Ceci est une estimation statistique, pas une preuve. La detection d'IA est intrinsequement incertaine. Des outils comme celui-ci peuvent produire des faux positifs pour l'ecriture academique, l'anglais non natif, la documentation technique et les styles formels. Ne l'utilisez pas comme seule base d'accusations de plagiat ou de malhonnetete academique.

Réponse rapide

Collez au moins 50 mots. L'outil calcule six signaux statistiques (burstiness, diversité du vocabulaire, expressions clichées, ponctuation, structure des phrases, répétition) et les combine en un score de probabilité d'IA de 0 à 100. La précision heuristique tourne autour de 65 à 75 pour cent. Traitez les résultats comme un point de départ, pas comme une preuve.

Comment Fonctionne la Détection d'IA

Les détecteurs heuristiques d'IA ne "lisent" pas votre texte. Ils comptent des caractéristiques de surface qui tendent à différer entre l'écriture humaine et celle de l'IA. Aucune caractéristique individuelle n'est une preuve à elle seule, c'est pourquoi les détecteurs solides combinent plusieurs signaux. Voici les six que cet outil utilise.

1. Burstiness

Le burstiness mesure la variation de la longueur des phrases dans un passage. Les humains oscillent naturellement entre des phrases très courtes (3 à 6 mots) et longues (25 à 40 mots). Les grands modèles de langage, entraînés pour optimiser la fluidité et la clarté, produisent des phrases qui se regroupent autour d'une moyenne de 15 à 22 mots avec une faible variance. L'outil calcule le coefficient de variation : une valeur au-dessus de 0,6 tend vers l'humain, en dessous de 0,3 tend vers l'IA. Le burstiness est le signal individuel le plus fort dans la plupart des références de recherche, c'est pourquoi nous le pondérons à 30 pour cent.

2. Diversité du Vocabulaire

La diversité du vocabulaire se mesure avec le ratio type-token : mots uniques divisés par mots totaux. Pour stabiliser la métrique sur différentes longueurs de texte, nous utilisons une fenêtre glissante de 100 mots et calculons la moyenne du TTR par fenêtre. L'écriture humaine se situe typiquement entre 0,65 et 0,80 sur cette mesure. La sortie IA se regroupe souvent entre 0,55 et 0,65, reflétant la tendance du modèle à réutiliser le vocabulaire dans un passage. Pondération : 20 pour cent.

3. Détection de Clichés par N-grammes

Nous scannons une liste organisée d'expressions que les modèles d'IA suremploient : « à l'ère du numérique », « il est important de noter », « plonger dans », « naviguer dans les complexités », « en conclusion », « de plus », « par ailleurs », « en outre » et d'autres. Ces expressions ne sont pas erronées en soi, mais leur densité dans un passage est un signal fort. Une expression toutes les 50 mots pousse le score vers l'IA. Pondération : 20 pour cent.

4. Profil de Ponctuation

Les modèles d'IA, en particulier la famille GPT-4, suremploient les tirets cadratins. La plupart des auteurs humains les utilisent avec modération. L'outil compte les tirets cadratins par 100 mots, la densité de points-virgules et le taux d'utilisation de la virgule d'Oxford. Un passage avec trois tirets cadratins en 200 mots est en soi un marqueur fort d'IA. Pondération : 15 pour cent.

5. Structure des Phrases

Deux caractéristiques structurelles : la fréquence à laquelle les phrases commencent par le même mot (une faible variation tend vers l'IA) et la fréquence à laquelle apparaît la voix passive (un taux élevé tend vers l'IA). Le détecteur approxime la voix passive en cherchant les verbes « être » (est, était, fut, sera, a été, étant) suivis dans les trois mots par un participe passé probable. Pondération : 10 pour cent.

6. Répétition d'Expressions

Nous extrayons chaque expression de 3 et 4 mots du texte et comptons les répétitions. Les expressions qui apparaissent trois fois ou plus poussent le score vers l'IA. Les humains paraphrasent généralement ; l'IA tourne autour de motifs. C'est le plus faible des six signaux (5 pour cent) parce que l'écriture légitime répète souvent la terminologie, mais cela ajoute des informations utiles à la marge.

Précision et Limites

Les évaluations indépendantes des détecteurs heuristiques d'IA (GPTZero, ZeroGPT, Copyleaks et les détecteurs académiques comme DetectGPT et GLTR) tombent systématiquement dans la fourchette de 65 à 80 pour cent de précision sur du texte de domaine mixte. Les mêmes études montrent que des sorties IA légèrement éditées peuvent faire chuter le taux de détection en dessous de 50 pour cent. Aucun détecteur, payant ou gratuit, ne dépasse 90 pour cent sur du texte adversarial.

Notre outil produira des faux positifs pour :

L'écriture académique : longueur uniforme des phrases, vocabulaire formel, langage nuancé.
L'anglais non natif : vocabulaire de travail plus restreint, structures plus répétées.
La documentation technique : voix passive, terminologie répétée, style formel.
Le texte d'entreprise ou juridique : expressions clichées, virgules d'Oxford, usage des points-virgules.
L'écriture très éditée ou modélisée : motifs qui paraissent mécaniques parce qu'ils le sont.

Utilisez le score comme point de départ d'une conversation, jamais comme un verdict. Pour les décisions à fort enjeu (discipline académique, embauche), combinez le détecteur avec d'autres preuves : historique de brouillons, échantillons d'écriture, conversation en personne sur le contenu.

Quand Utiliser la Détection d'IA

Il existe de vrais cas d'usage pour un détecteur heuristique, à condition de comprendre les limites :

Les enseignants qui vérifient les dissertations d'étudiants pour un tri rapide avant un examen plus approfondi. Un score élevé signale « regardez de plus près », pas « notez zéro ».
Les éditeurs qui vérifient le travail freelance pour confirmer qu'un auteur livre la voix humaine pour laquelle il a été engagé.
Les recruteurs qui examinent les lettres de motivation comme une entrée parmi d'autres. Un score de 95 sur une lettre de motivation est un drapeau jaune qui mérite un suivi.
L'autovérification avant publication pour repérer les passages qui se lisent comme du ChatGPT et les réécrire dans votre voix.
Les audits d'authenticité de contenu lors de l'examen d'un lot de livrables, d'articles de blog ou de copie produit.

Comparaison avec d'Autres Détecteurs

Plusieurs détecteurs d'IA connus existent, chacun avec ses compromis :

GPTZero utilise la perplexité et le burstiness avec des modèles propriétaires. Palier gratuit avec limites, formules payantes pour les volumes plus élevés.
Originality.ai est uniquement payant et vise les éditeurs SEO. Il utilise un classifieur entraîné sur mesure.
ZeroGPT est gratuit avec un palier payant. Il utilise la perplexité et le burstiness similaires à GPTZero.
Copyleaks est axé entreprise avec plagiat plus détection d'IA dans un seul produit.

Notre outil est gratuit, totalement dans le navigateur, ne demande pas d'inscription et ne voit jamais votre texte. Il ne prétend pas surpasser les options payantes. Le bénéfice, c'est la confidentialité et zéro friction. Si vous avez besoin de plus de confiance pour une décision critique précise, un détecteur payant est raisonnable. Pour le tri quotidien, un outil heuristique transparent suffit généralement.

Questions Fréquentes

L'outil combine six signaux statistiques en un score de probabilité d'IA de 0 à 100 : burstiness (variation de la longueur des phrases), diversité du vocabulaire, expressions clichées typiques de l'IA, profil de ponctuation (densité de tirets cadratins, points-virgules, virgules d'Oxford), structure des phrases (variation des débuts et taux de voix passive) et répétition d'expressions de 3 et 4 mots. Chaque signal est pondéré selon la fiabilité avec laquelle il distingue l'écriture IA de l'écriture humaine dans la littérature de recherche. Tout le calcul se déroule dans votre navigateur.

Non. Aucun détecteur d'IA n'est fiable à 100 %, y compris les services payants comme GPTZero, Originality.ai et ZeroGPT. Des études indépendantes montrent que les détecteurs heuristiques tournent autour de 65 à 75 pour cent de précision sur du texte mixte. Notre score est un point de départ, pas un verdict. Traitez les scores en dessous de 30 comme « tendance humaine », 30 à 70 comme « incertain », et plus de 70 comme « tendance IA ». N'utilisez jamais le score d'un détecteur comme seule base pour des accusations de plagiat ou de malhonnêteté académique.

Les signaux que nous suivons (expressions clichées comme « plonger dans », usage intense des tirets cadratins, longueurs de phrases uniformes) sont plus prononcés dans les sorties de GPT-3.5 et GPT-4. Claude tend à produire des longueurs de phrases plus variées et moins d'expressions standards, donc ses textes obtiennent souvent des scores plus bas. Gemini se situe au milieu. L'outil n'est pas réglé sur un modèle spécifique. Il recherche des signatures statistiques générales du texte généré par LLM, donc les sorties IA éditées ou soigneusement promptées peuvent passer sous le seuil.

Les détecteurs heuristiques recherchent des motifs statistiques, pas l'auteur. Plusieurs types d'écriture partagent des motifs avec l'IA : les travaux académiques (longueur uniforme des phrases, vocabulaire formel), l'anglais non natif (vocabulaire limité, structures répétées), la documentation technique (voix passive, terminologie répétée) et le texte d'entreprise ou juridique (expressions clichées, ponctuation formelle). Si vous écrivez dans un style mesuré et cohérent, vous pouvez obtenir un score plus élevé que prévu. Le détecteur ne « sait » rien au-delà des caractéristiques de surface qu'il compte.

Non. Toute l'analyse est exécutée localement dans votre navigateur en JavaScript. Votre texte ne quitte jamais votre appareil, n'est pas téléversé, n'est pas enregistré et n'est utilisé pour entraîner aucun modèle. Vous pouvez le vérifier en ouvrant les outils de développement de votre navigateur et en consultant l'onglet réseau pendant que l'analyse s'exécute : aucun trafic réseau. Nous ne stockons pas non plus votre texte sur nos serveurs, car nous n'y avons pas accès.

Six signaux : (1) Burstiness, le coefficient de variation des longueurs de phrases. (2) Diversité du vocabulaire, mesurée par le ratio type-token avec une fenêtre glissante de 100 mots. (3) Détection de clichés par n-grammes, qui scanne les expressions standards de l'IA comme « à l'ère du numérique » et « il est important de noter ». (4) Profil de ponctuation, qui suit la densité des tirets cadratins, des points-virgules et des virgules d'Oxford. (5) Structure des phrases, qui mesure la variation des débuts et le taux de voix passive. (6) Répétition d'expressions, qui compte les expressions de 3 et 4 mots apparaissant trois fois ou plus.

Oui, et facilement. Une édition légère d'une sortie IA (changer les expressions clichées, casser les phrases longues et uniformes, ajouter une voix personnelle et des contractions) baissera le score de manière significative. C'est une limite fondamentale de chaque détecteur heuristique. Les mêmes modifications qui trompent notre outil tromperont aussi GPTZero et ZeroGPT. Si vous devez vérifier l'authorat pour une décision à fort enjeu, combinez un détecteur avec d'autres preuves : historique d'écriture, vérification en personne, historique des brouillons dans Google Docs ou Word et conversation directe sur le contenu.

Sources

Mitchell, E., Lee, Y., Khazatsky, A., Manning, C. D., Finn, C. (2023). "DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature." Proceedings of the 40th International Conference on Machine Learning.
Solaiman, I., Brundage, M., Clark, J., et al. (2019). "Release Strategies and the Social Impacts of Language Models." OpenAI Report.
Gehrmann, S., Strobelt, H., Rush, A. M. (2019). "GLTR: Statistical Detection and Visualization of Generated Text." ACL System Demonstrations.
Bhattacharjee, A., Liu, H. (2023). "Fighting Fire with Fire: Can ChatGPT Detect AI-generated Text?" SIGKDD Explorations Newsletter.
GPTZero (2023). "How AI Text Detectors Work." Documentation méthodologique publique.

Outils Associés